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一 菏 注 


腹 喇 


在 我 们 最 意 想 不 到 的 地 方 。 从 我 们 在 脸 书 (Facebook) 上 的 朋友 
征 谁 ， 到 我 们 的 信息 如 何在 几 盈 秒 内 通过 互联 网 传播 ， 这 一 切 的 背后 
都 有 着 有 趣 的 故事 ， 不 管 那 是 社交 网 络 、 通 信和 网络 还 是 经 济 网 络 。 无 
论 是 推荐 电影 ， 控 制 设 备 的 功率 水 平 ， 还 是 视频 的 病毒 式 传播 ， 在 这 
些 功 能 和 其 他 功能 的 内 部 运作 中 部 隐藏 厦 六 条 原则 ， 它 们 会 出 现在 各 
种 各 样 的 网 络 中 。 


本 书 运 用 通俗 易 懂 的 语言 ， 对 这 些 原 则 以 及 网 络 的 力量 加 以 说 
明 。 许 多 优秀 的 文章 已 经 从 数学 和 技术 角度 对 网 络 进行 了 详细 阐述 ， 
但 本 书 和 它们 不 一 样 。 


与 之 相反 ， 本 书 通过 故事 、 铬 片 、 例 子 和 历史 逸事 搞 述 了 网 络 的 
核心 理念 ， 其 中 还 包括 与 谷歌 的 埃 里 克 - 施 密 特 ， 威 瑞 森 无 线 前 首席 执 
行 冒 丹尼斯 -斯 特 里 格 尔 ， 以 及 “互联 网 之 父 ” 瘟 顿 : 瑟 夫 和 罗伯特 : 卡 恩 
的 对 话 。 全 书 共 有 数 百 张 独 片 ， 图 片 会 对 文本 加 以 补充 。 我 们 还 会 将 
网 络 和 日 常生 活 的 其 他 方面 进行 类 比 。 你 可 能 会 惊讶 地 发 现 邮 政 系 
统 、 交 通 拥堵 和 停车 标志 ， 分 别 与 互联 网 路 径 选择 、 网 络 拥塞 和 Wi-Fi 

(无 线 局 域 网 ) 随机 访问 非常 相似 。 


这 并 不 是 说 本 书 不 会 出 现任 何 数 学 知识 。 数 子 示例 对 理解 驱动 网 
络 的 方法 非常 有 帮助 。 但 是 你 在 本 书 中 看 到 的 数学 知识 不 会 比 基 本 的 
算术 〈 数 字 的 相 加 和 相 乘 ) 更 复杂 。 想 要 阅读 本 书 ， 你 只 需要 有 学 习 
的 欲望 即 可 。 


本 书 的 结构 是 什么 ? 它 分 为 六 个 部 分 ， 每 个 部 分 对 应 连接 我 们 生 
活 中 的 六 条 网 络 原 则 之 一 。 每 个 部 分 包含 两 到 三 草 ， 通 过 有 趣 的 主 


题 ， 讲 述 相应 原则 的 故事 。 


那么 ， 这 六 条 原则 征 什么 ? 它们 简 活 明了 ， 完 美 总 结 出 设计 、 建 
造 和 管理 网 络 的 方式 。 


原则 一 : 分 享 很 难 〈 第 一 部 分 ) 。 不 论 是 用 手机 打 电 话 还 是 用 
Wi-Fi 上 网 ， 痢 需要 分 至 网 络 媒介 。 它 束 像 空气 一 样 ， 你 需要 和 许多 其 
他 人 共 至 。 在 这 种 情况 下 ， 怎 么 才能 不 干扰 彼此 的 连接 呢 ? 这 就 需要 
有 效 的 分 至 和 协调 技术 一 一 从 控制 电话 传输 的 等 级 到 对 我 们 所 消费 的 
数据 定价 。 


原则 三 ， 排 序 很 难 (第 二 部 分 ) 。 今 天 的 许多 网 站 都 需要 处 理 大 
量 原 始 数据 ， 以 找到 有 效 的 排序 方法 。 像 谷歌 这 样 的 搜索 引擎 如 何 对 
至 现 给 我 们 的 结果 进行 排序 ? 网 站 如 何 为 广告 商 分 配 空间 ?” 随 痢 需要 
排序 的 项 目 越 来 越 复杂 ， 排 序 工作 也 变 得 更 加 困难 。 


原则 三 ， 大 众 很 聪明 (第 三 部 分 。 亚 马 进 和 网 飞 (Netflix) 等 
在 线 零 售 及 娱乐 公司 拥有 很 多 顾客 。 我 们 是 否 能 够 对 大 众 的 意见 产生 
影响 ， 使 产品 评价 及 推荐 更 加 准确 和 有 用 ? 答案 是 肯 定 的 ， 但 我 们 需 
要 对 大 众 意 见 及 其 生成 机 制 做 一 些 特定 的 假设 。 


当 这 些 假 设 站 不 住 脚 时 ， 就 需要 原则 四 : 大 众 并 不 那么 聪明 (第 
四 部 分 ) 。 为 何 有 些 视频 会 出 现 病 毒 式 传播 ? 因为 人 们 可 以 影响 彼此 
的 行为 和 决策 。 在 社交 网 络 中 ， 某 些 人 是 否 比 其 他 人 更 具 影 啊 力 ? 是 
的 ， 而 且 他 们 的 影响 方式 并 不 一 定 很 直观 。 本 书 将 对 此 进行 解释 。 


分 而 治之 是 第 五 条 网 络 原则 (第 五 部 分 。 通 过 这 一 概念 ， 互 联 
网 的 规模 和 功能 可 以 有 效 地 增加 (从 路 径 选 择 到 数据 纠 错 ) 。 从 地 理 
和 功能 上 ， 互 联网 都 被 巧妙 地 分 成 了 很 小 的 部 分 ， 因 此 每 部 分 都 可 以 
被 单独 管理 。 


原则 六 : 端 到 端 〈 第 六 部 分 ) 。 这 是 最 后 一 条 原则 ， 它 主要 讨论 
网 络 如 何在 巨大 的 空间 里 运作 。 我 们 手中 的 终端 设备 往往 不 知道 ， 也 
不 需要 知道 ， 互 联网 中 到 底 发 生 了 什么 ， 以 实现 分 配给 它们 的 各 种 功 
能 ， 例 如 拥堵 控制 。 而 在 网 络 中 ， 执 行 一 项 任务 的 具体 位 置 是 一 个 重 
要 的 问题 。 


在 全 书 中 ， 你 将 看 到 参考 补充 材料 的 提示 。 补 充 材 料 可 在 本 书 的 
网 站 www.powerofnetworks.org 上 找到 。 材 料 按 章节 划 分 ， 被 组 织 成 系 
列 问 答 。 如 采 你 在 基本 了 解 原则 以 外 ， 想 深入 控 掘 其 中 的 一 些 例子 、 
历史 和 更 多 的 技术 信息 ， 可 阅读 这 些 材料 。 


除了 作为 大 众 科普 读物 ， 本 书 和 网 站 上 的 内 容 也 可 以 作为 大 学 或 
高 中 入 门 课程 的 基本 材料 ， 可 供 任何 专业 或 学 科 对 网 络 感 兴趣 的 学 生 
使 用 。 教 学 资源 可 以 在 本 书 的 网 站 上 获取 ， 也 可 以 发 送 电子 邮件 给 我 
们 (地 址 learnPoN@gmail.com) 。 事 实 上 ，2013 年 以 来 ， 本 书 中 的 很 
多 材料 已 经 被 用 在 大 规模 开放 网 络 课程 (Massive Open Online 
Course， 莫 课 ) 上 ， 有 超过 100 000 名 学 生 学 习 过 。 


我 们 从 写作 本 书 中 获得 了 很 多 乐趣 ， 和 希望 你 也 能 从 阅读 本 书 中 获 
得 乐趣 | 


化 几 秒 钟 ， 坐 下 来 想象 一 下 ， 如 有 果 没 有 手机 ， 你 的 生活 将 会 怎 
样 。 这 可 能 很 困难 ， 因 为 每 次 联系 老板 或 家 人 ， 或 者 跟 任 何人 远程 
沟通 ， 你 都 只 能 使 用 固定 电话 。 然 后 再 往 前 想 ， 回 到 家 里 有 电话 以 
前 。 在 那个 时 候 ， 信 息 传 播 的 速度 ， 仅 等 于 你 或 邮递 员 在 街道 之 间 
步行 的 速度 、 火 车 在 城市 间 行 驶 的 速度 ， 或 是 货船 在 大 陆 间 路 海航 
行 的 速度 。 虽 然 很 难 想 象 ， 但 这 吏 是 在 有 线 和 无 线 通 信 出 现 之 前 ， 
人 们 数 干 年 来 的 生活 方式 。 这 些 技术 使 通信 速度 大 大 加 快 ， 同 时 也 


给 网 络 资源 如 何在 这 么 多 人 之 间 实 现 “ 共 吝 ”"， 市 来 了 许多 有 趣 的 挑 
Ey 


在 本 书 第 一 部 分 ， 我 们 将 探讨 两 种 无 线 网 络 : 蜂窝 (第 1 章 ) 和 
Wi-Fi (第 2 章 ) 。 在 研究 这 些 网 络 时 ， 我 们 将 看 到 两 种 共享 通信 资 
源 (在 这 种 情况 下 ， 是 指 空气 中 的 电磁 频谱 ) 的 方式 ， 以 此 进行 通 
信 。 控 制 干扰 是 关键 : 这 需要 使 用 方法 ， 在 后 台 分 析出 你 进行 通信 
的 时 间 和 音量 。 

网 络 定价 (第 3 章 ) 也 可 以 是 一 个 实现 更 高 效 资源 共享 的 有 效 方 
式 。 我 们 将 看 到 网 络 供应 商 使 用 的 方法 ， 来 确定 我 们 为 消费 的 数据 
支付 多 少 费 用 。 


第 1 章 
控制 你 的 “ 首 量 » 


如 今 ， 手 机 已 成 为 我 们 日 常生 活 的 一 部 分 。 图 1-1 显 示 了 部 分 国家 
在 2015 年 年 中 的 手机 渗透 率 (mobile penetration) ， 即 各 国平 均 
每 人 拥有 的 手机 数量 。 请 注意 ， 最 左 侧 5 个 国家 的 渗透 率 均 超过 
100%， 说 明 在 这 些 国家 ， 手 机 数量 超过 了 人 口 数量 。 


此 外 ， 在 2015 年 年 中 ， 图 1-1 中 的 13 个 国家 均 拥 有 超过 1 亿 的 手机 
入 网 量 。 同 一 时 期 ， 全 世界 手机 入 网 量 超过 6 800 000 000 (68 亿 ! 
) o 

既然 数量 如 此 巨大 ， 你 也 许 会 问 ， 我 们 如 何 能 有 效 地 进行 无 线 通 
信 ， 而 不 会 干扰 彼此 通话 、 收 发 信息 及 上 网 ? 我 们 将 在 本 书 这 一 部 分 
分 享 几 种 方法 ， 本 章 首先 介绍 功率 (通话 音量 ) 控制 。 


现代 移动 蜂窝 (cellular) 系统 是 几 十 年 来 技术 革新 的 产物 。20 
世纪 40 年 代 至 80 年 代 ， 移 动 设备 尚 属 奢 侈 品 ， 而 到 了 21 世 纪 ， 则 变 成 
了 必需 品 。 伴 随 这 一 趋势 ， 工 程 师 们 必须 想 出 能 让 人 们 进行 无 线 通信 
的 不 同方 式 。 


手机 数 超过 
人 口 数 
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注 : 图 为 截至 2015 年 6 月 ， 部 分 国家 的 手机 渗透 率 ， 即 平均 每 人 拥有 的 手机 数量 。 其 中 6 个 国 
家 的 渗透 率 为 100% 或 以 上 ， 说 明 这 些 国家 的 手机 数量 超过 人 口 数 量 


从 电话 到 手机 


在 无 线 网 络 和 手机 出 现 之 前 ， 通 信和 网 络 主要 依靠 有 线 
(wireline ) 手段 ， 即 利用 线 缆 进 行 通 信 ， 与 之 相对 的 是 无 线 
(wireless) 通信 。 早 在 1876 年 10 月 9 日 ， 通 过 从 波士顿 到 坎 布 里 奇 的 

一 段 2 英里 中 长 的 线 缆 ， 亚 历 山大 .格雷 厄 姆 .贝尔 拨打 出 了 世界 上 第 一 
通电 话 。 第 二 年 ， 贝 尔 电话 公司 成 立 。 那 是 第 一 家 提供 公共 交换 电 
话 网 络 (public switched telephone network) 服务 的 公司 (我 们 
通常 称 之 为 “固定 线路 ”) 。 


在 设计 电话 前 ， 贝 尔 正在 对 此 前 发 明 的 电报 进行 实验 。 利 用 “复式 
电报 机 ”， 多 个 发 送 者 (transmitters ， 信 息 发 出 方 ) 和 接收 者 


(receivers， 信 息 接收 方 ) 能够 通过 一 条 线路 进行 联系 。 


试想 一 下 : 我 们 如 何 能 像 图 1-2 那 样 ， 让 许多 人 使 用 同一 条 线路 
呢 ? 假如 安娜 和 本 正 试图 通话 ， 查 理 和 达 娜 也 是 ， 这 难道 不 会 导致 他 
们 干扰 彼此 的 通话 吗 ? 


安娜 本 


线路 
/1 
查理 达 娜 
图 1-2 


FE 在 和 达 娜 打 电 话 ， 两 对 通话 者 如 何 能 在 使 用 同一 条 线 


注 : 假设 安娜 正在 和 本 打 电 话 ， 查 理 
路 时 ， 不 互相 干扰 呢 


其 实 未 必 。 虽 然 他 们 在 使 用 同一 个 空间 (电话 线 ) ， 但 我 们 可 以 
在 其 他 层面 把 他 们 分 开 。 最 直接 想到 的 或 许 是 时 间 : 让 安娜 和 本 占用 
一 会 儿 电话 线 ， 然 后 让 查理 和 达 娜 用 一 会 儿 ， 再 让 安娜 和 本 用 ， 如 此 
反复。 我 们 还 可 以 试 着 用 语言 来 区 分 ， 让 安娜 和 本 说 美语 ， 查 理 和 达 
娜 说 西班牙 语 。 这 样 他 们 束 能 同时 通话 ， 只 需要 听 目 己 的 语言 束 行 。 
即便 如 此 ， 我 们 还 是 要 担心 不 同 的 说 话 声 会 次 住 彼此 。 


这 些 层 面 一 时 间 和 语言 ， 是 不 同 多 址 联 (multiple access) 
技术 的 简化 例子 。 这 些 技术 使 多 个 通话 者 能 共用 同一 网 络 媒介 (如 电 
话 线 和 无 线 信 号 ) 。 我 们 将 在 本 章 对 其 进行 深入 探讨 。 


按 不 同 频率 进行 共享 


复式 电报 机 根据 不 同 频率 ， 利 用 频 分 多 址 (frequency division 
multiple access，FDMA) 将 不 同 连 接 进 行 区 分 。FDMA 会 为 每 组 
发 送 者 和 接收 者 ( 称 为 一 个 “链接 ”) 分 配 一 个 频道 〈frequency 
channel) ， 使 其 能 进行 联系 。 你 可 以 在 图 1-3 中 看 到 图 示 。 


时 间 
图 1-3 


注 : 通过 频 分 多 址 ， 根 据 通话 的 指定 频道 对 其 进行 区 分 : 通话 一 的 用 户 被 分 到 一 个 频道 ， 通 
话 二 的 用 户 被 分 到 男 一 个 频道 ， 以 此 类 推 


“频率 "是 什么 ? 对 于 我 们 能 听 到 的 频率 ， 可 以 理解 为 声音 的 不 同 
音调 。 频 率 以 赫兹 《hertz，Hz) 为 单位 进行 衡量 ， 表 示 声 波 平均 每 
秒 完成 的 循环 次 数 。 因 此 10 赫 效 表示 声波 每 秒 完成 10 次 循环 ( 见 图 1- 
4) 。 关 于 频道 的 更 多 信息 ， 请 参见 本 书 网 站 的 Q1.1 部 分 。 


频率 单位 将 在 本 书 此 部 分 多 次 被 所 到 ， 但 我 们 即将 探讨 的 频率 苑 
围 远 远 超 过 一 赫 歼 的 数量 级 。 通 党 所 到 的 无 线 频 市 为 数 百 万 赫 效 或 数 
十 亿 赫兹 ， 分 别称 为 兆赫 (MHz) 和 千 兆 赫 (GHz) 里 。 为 了 帮助 你 
理解 这 些 数 字 的 概念 ， 人 类 能 听 到 的 最 高 频率 为 大 约 20 000 赫 效 。 


-一 1 赫 效 --- 3 赫 效 


0 ] 2 
时 间 ( 秒 ) 


图 1-4 


注 : 不 同 频率 的 两 条 声波 ， 表 示 平 均 每 秒 完成 的 循环 次 数 。 实 线 波 频 率 为 1 赫 效 ， 虚 线 波 频率 
为 3 赫兹 


第 一 代 移 动 电话 始 于 20 世 纪 二 三 十 年 代 ， 运 用 了 FDMA 技 术 。 它 
们 在 本 质 上 是 模拟 (analog) 的 ， 也 就 是 说 ， 它 们 的 信号 完全 以 电 
的 形式 从 空中 穿 过 。1946 年 ， 贝 尔 电话 公司 建立 第 一 套 “ 移 动 电话 ”网 
络 ， 称 为 “移动 电话 服务 系统 ”。 这 套 系 统 与 1964 年 出 现 的 新 一 代 系 统 


一 样 ， 都 是 FDMA 系 统 。 它 们 被 认为 是 第 零 代 技术 ， 也 叫 作 0G， 与 之 
相对 的 古 我 们 现在 使 用 的 4G 技 术 。 


第 一 台 手 持 电 话 


20 世 纪 70 年 代 ， 摩 托 罗 拉 公 司 的 马丁 . 库 班 坚信 ， 手 持 电话 将 成 为 
未 来 的 漳 流 。1973 年 ， 他 带领 团队 花 了 90 天 ， 制 造 出 史上 第 一 台 手 持 
电话 : DynaTAC。 


DynaTAC 并 不 像 今 天 的 手机 。 它 重 达 近 2 磅 ( 约 0.9 千 克 ) ， 价 格 
接近 3 000 美 元 (1973 年 的 美元 价值 ! ) ， 通 话 30 分 钟 便 需 要 充电 。 相 
比 之 下 ，2016 年 的 一 台 苹 果 手 机 重量 不 到 1/3 磅 〈 约 0.15 千 克 ) ， 价 格 
可 低 至 150 美 元 (取决 于 具体 型 号 和 无 线 网 络 合同 ) ， 并 且 每 次 充电 后 
可 供 数 小 时 通话 及 数据 应 用 使 用 。 


直到 20 世 纪 90 年 代 中 期 ， 手 持 电话 产业 才 真正 开始 脱离 车 载 电 
话 。 与 数字 网 络 类 似 ， 只 有 当 电 子 元 件 成 本 开始 大 幅 下 降 ， 手 党 大 小 
的 电话 才 变 得 实际 。 而 电子 元 件 成 本 下 降 ， 部 分 是 因为 需求 上 升 。 需 
求 之 所 以 上 升 ， 部 分 是 因为 这 些 技术 的 应 用 增加 了 。 


“ 妖 窜 电话 "的 < 蜂窝” 


1976 年 ， 仪 纽约 市 就 有 大 约 500 名 手机 用 户 ， 在 等 等 名单 上 的 人 数 
超过 这 个 数字 的 6 倍 。 网 络 容量 (capacity) 急需 扩大 。 那 么 ， 网 络 
运营 两 能 做 什么 昵 ? 实际 上 只 有 两 种 选择 : 请 求 联 邦 通信 委员 会 

(Federal Communications Commission， 人 简称 FCC) 提供 更 多 频谱 ， 或 


找 出 一 种 方法 ， 使 更 多 用 户 能 使 用 同一 频谱 。 


有 关 FCC 许 可 过 程 的 更 多 信息 ， 请 查看 本 书 网 站 的 Q1.2 部 分 。 如 
何 让 更 多 的 用 户 共 至 同一 频谱 ?也 许可 以 重复 使 用 频道 ? 这 似乎 有 点 
儿 率 强 ， 如 有 果 有 两 个 链接 紧 挨 着 彼此 ， 叉 在 使 用 相同 的 频道 ， 肯 定 会 


产生 干扰。 但 是 ， 如 果 它 们 不 在 彼此 旁边 呢 ? 如 果 它 们 距离 足够 远 ， 
那么 可 以 重复 使 用 同一 个 频道 吗 ? 

答案 是 肯定 的 。 当 信号 通过 空气 (以 及 通过 线 绕 ) 传播 ， 其 功率 
电 平 会 衰减 (attenuate) 。 这 意味 着 它们 会 随 着 距离 增加 而 减 小 ， 
如 图 1-5 所 示 。 
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图 1-5 


注 : 当 信 号 通过 空气 传播 ， 其 功率 电 乎 会 误 减 。 在 安娜 的 手机 周围 ， 她 的 手机 发 射 功 率 电 平 
是 100。 当 信号 到 达 本 时 ， 功 率 电 平 是 50。 到 达 碍 理 时 ， 有 是 10 


通常 情况 下 ， 惨 减 被 看 作 是 一 件 坏 事 。 它 会 导 人 致 信号 减弱 ， 使 其 
难以 远 距 离 传送 。 但 这 正 是 我 们 所 需要 的 : 如 有 果 你 和 我 相距 足够 远 ， 
我 们 束 都 可 以 打 电 话 ， 而 且 也 不 会 导致 信号 在 空中 重 谷 。 


衰减 的 特性 使 得 工程 师 开 始 从 地 理 上 把 移动 信号 区 划分 为 一 个 个 
蜂窝 (cell) ， 通 常 表示 为 “六 边 形 *。 这 个 想法 是 ， 任 何 指定 的 蜂窝 
都 可 以 被 分 配 一 组 不 被 相 邻 蜂窝 使 用 的 频率 。 这 样 ， 使 用 同一 频道 的 
蜂窝 将 距离 彼此 很 远 ， 不 会 产生 干扰 ， 使 我 们 能 够 更 有 效 地 使 用 现 有 
的 资源 。 


你 可 以 在 图 1-6 中 看 到 蜂 宛 网 络 的 示例 。 在 这 里 ， 任 何 具有 相同 颜 
色 的 六 边 形 将 被 分 配 相同 的 频率 ， 因 为 它们 不 相 邻 。 假 如 颜色 最 深 的 
得 到 频道 1 至 4， 颜 色 深 度 居 中 的 得 到 5 至 8， 闫 色 最 浅 的 得 到 9 至 12。 罗 
布 在 深 色 蜂 坑 里， 位 于 频道 2。 在 他 的 蜂 二 里 的 其 他 人 可 能 处 于 1、3 或 
4 频道 。 由 于 蕾 切 尔 古 在 男 一 个 深 色 蜂 寅 里 ， 因 此 她 也 可 以 被 分 配 到 频 
道 2， 因 为 她 距离 足够 还。 本 在 中 间 的 蜂 宫 ， 则 不 能 得 到 频道 2， 因 为 
他 太 接 近 深 色 蜂 宪 。 我 们 为 不 同 蜂 寅 指定 颜色 (频率 ) 时 ， 经 常 想 让 
使 用 的 颜色 数量 尽 可 能 小 。 找 到 那样 的 颜色 组 合 实际 上 十 相当 困难 
的 ， 特 别 十 当 图 中 单元 格 的 数目 变 得 非常 庞大 时 。 


图 1-6 
注 : 这 是 一 张 蜂窝 网 络 图 。 每 个 单元 都 是 一 个 六 边 形 ， 包 括 多 个 移动 站 (MS) 和 基站 


(BS) 。 单 元 格 的 颜色 深度 表示 单元 格 使 用 的 频带 。 相 邻 两 个 单元 格 没有 相同 的 颜色 ， 因 此 


使 用 不 同 的 频带 以 防止 干扰 


那么 每 个 蜂窝 里 有 什么 ?” 有 基站 (base stations) ， 也 叫 BS 
以 及 移动 站 (mobile stations) ， 也 叫 MS。 每 个 蜂窝 的 基站 一 端 连 
接 有 线 核 心 网 和 互联 网 ， 另 一 端 连 接 分 配给 它 的 移动 站 。 移 动 站 可 以 
是 一 部 手机 、 一 台 平 板 电 脑 ， 或 任何 可 以 根据 蜂窝 标准 发 送 和 接收 信 
号 的 设备 。 


单元 首先 在 先进 的 移动 电话 系统 中 使 用 ， 标 志 着 1G 技 术 在 美国 的 
诞生 。 在 这 个 系统 中 ， 移 动用 户 数 量 猛 增 。 到 20 世 纪 90 年 代 ， 仪 在 类 
国 束 有 2 500 万 名 手机 用 户 。 这 也 意味 着 ， 由 于 高 使 用 率 和 低 容 量 ， 模 
拟 信号 已 经 无 法 满足 需求 。 


进入 数字 时 代 


随 着 模拟 网 络 再 次 变 得 拥挤 ， 美 国 和 其 他 各 国 开 始 尝试 另 一 种 选 
择 : 数字 (digital) 系统 。 模 拟 信号 将 被 “数字 化 ”， 转 换 成 二 进 制 
位 的 序列 ， 即 1 和 0 ( 见 图 1-7) 。 


模拟 信号 


O11000110110111 


图 1-7 
注 : 模拟 信号 随 着 时 间 不 断 变 化 。 与 之 相反 ， 数 字 信 号 是 一 系列 的 二 进 制 位 ， 即 1 和 0 


数字 系统 在 容量 上 拥有 巨大 优势 ， 因 为 它们 使 用 了 另外 两 个 我 们 
将 讨论 的 多 址 联接 技术 。 在 20 世 纪 80 年 代 末 之 前 ， 建 立 这 些 网 络 所 需 
的 小 规模 电子 设备 成 本 还 不 够 低 。 


按照 时 间 〈《 和 频率 ) 进行 共享 


从 模拟 到 数字 蜂 罕 的 转换 标志 着 1G 技 术 发 展 到 了 2G。 第 一 套 2G 
技术 标准 是 全 球 移动 通信 系统 ， 人 简称 GSM， 始 于 1982 年 。 到 1987 年 ， 
该 系统 容量 便 达 到 模拟 系统 的 3 倍 。 


数字 代码 使 我 们 能 将 多 个 通话 压缩 到 一 个 频段 。 所 以 ， 即 使 在 一 
个 单元 里 ， 我 们 也 可 以 让 很 多 人 共用 同一 个 频道 。 我 们 只 需要 添加 田 
一 个 维度 。 最 明显 的 额外 维度 选择 是 时 间 。 


换 句 话说 ， 多 个 用 户 可 以 共享 同一 个 频道 ， 但 他 们 必须 轮流 使 
用 。 按 照 一 套 叫 作 时 分 多 址 (time division multiple access， 简 
称 TDMA) 的 方案 ， 每 人 被 分 配 到 不 同 的 时 段 。 你 可 以 在 图 1-8 中 看 
到 TDMA 的 一 个 例子 。 


EEC 
Eola len 


时 间 
图 1-8 
注 : 利用 时 分 多 址 ， 一 定数 量 的 通话 (图 中 为 3 个 ) 可 以 共享 相同 的 频道 。 例 如 ， 通 话 A、B 
和 C 被 分 配 到 相同 的 频道 ， 但 在 时 间 上 是 分 开 的 


由 于 欧盟 倾向 于 发 展 一 套 共同 的 标准 ，GSM 在 欧洲 很 多 地 区 被 迅 
速 采 纳 。GSM 今 天 仍然 在 世界 部 分 地 区 使 用 ， 主 要 在 900MHz 和 1 
800MHz 频 段 运行 。 这 降低 了 手机 成 本 ， 标 志 着 手机 发 展 进 入 新 阶段 ， 
能 提供 短信 、 游 戏 ， 以 及 其 他 娱乐 功能 。 

按照 代码 进行 共享 

在 美国 ， 采 用 2G 标 准 的 历程 更 有 趣 。 在 了 解 对 容量 的 需求 增加 
后 ， 美 国 蜂窝 电信 行业 协会 在 1988 年 发 布 了 一 系列 性 能 要 求 ， 规 定 通 


信行 业 应 致力 于 达到 第 一 套数 子 蜂窝 标准 。 其 中 的 主要 要 求 是 ， 容 量 
应 达到 传统 模拟 网 络 的 10 倍 。 


这 个 时 候 ， 几 乎 所 有 美国 的 网 络 运 营 商 和 设备 制造 商都 觉得 
TMDA 是 最 好 的 办 法 ， 但 高 通 (Qualcomm) 公司 例外 。 该 公司 倡导 另 
一 项 技术 一 _ 码 分 多 址 (code division multiple access ， 简 称 
CDMA) 。 如 图 1-9 所 示 ， 在 CDMA 系 统 中 ， 用 户 在 “代码 ”维度 上 进 
行 区 分 ， 在 时 间 和 频率 上 则 不 加 区 分 。 对 代码 最 好 的 类 比 可 能 是 语 
言 : 就 像 给 每 个 链接 不 同 的 语言 ， 然 后 让 它们 进行 通话 一 样 。 


时 间 


代码 


图 1-9 
注 : 通过 码 分 多 址 ， 通 话 按照 “代码 ”维度 进行 区 分 。 所 有 通话 可 以 在 相同 的 频率 和 时 间 进 


行 ， 因 为 网 络 中 的 每 个 传输 都 会 被 分 配 到 唯一 的 代码 


每 个 代码 都 像 一 把 钥 是 。 发 送 方 锁定 消息 ， 将 其 发 送出 去 ， 并 且 

只 给 接收 方 发 送 密 钥 。 设 计 这 些 代码 的 困难 在 于 ， 应 该 只 有 一 把 钥 古 
E 够 “解锁 ”任何 指定 信号 。 如 果 男 一 个 接收 方 试图 用 目 己 的 钥匙 解密 
该 消 且 ， 则 应 该 显示 为 品 声 。 每 一 个 代码 会 “取消 ” 为 一个， 具有 此 属 


门 
全 
日 


性 的 代码 集合 被 称 为 一 个 正 交 码 (orthogonal codes) 族 。 关 于 
CDMA 的 更 多 信息 ， 请 参考 本 书 网 站 的 Q1.3 部 分 。 


一 开始 有 人 预测 ，CDMA 能 提供 的 容量 可 以 比 传统 模拟 网 络 大 40 
倍 以 上 。 尽 管 如 此 ， 当 时 大 多 数 工程 师 、 制 造 商 以 及 运营 商都 抵制 
CDMA。 原 因 之 一 是 ， 当 时 尚未 有 CDMA 蜂 窝 网 络 原 型 ， 对 其 进行 演 
不 o 


1989 年 ， 蜂 色 电 信行 业 协会 投票 通过 ， 将 TDMA 作 为 美国 第 一 个 


2G 数 字 标 准 。 示 来 4 年 中 ， 需 要 更 多 的 概念 证 明 ，CDMA 才 会 得 到 批 
准 。 


鸡尾酒 会 的 比喻 


这 里 有 一 个 易于 理解 的 比喻 ， 能 阐明 一 些 我 们 已 经 介绍 过 的 技 
术 。 假 设 一 场 鸡尾酒 会 在 一 座 有 许多 房间 的 大 厦 举 行 ， 其 中 有 许多 谈 
话 发 生 。 假 如 聚会 上 有 很 多 人 ， 如 采 大 家 都 挤 在 同一 个 房间 ， 同 时 说 
话 ， 我 们 将 很 难听 清 目 己 的 对 话 内 容 。 我 们 让 主人 来 确定 应 对 这 一 局 
面 的 最 好 方式 。 


主人 首先 决定 ， 每 个 房间 里 可 以 有 两 个 人 谈话 。 每 对 谈话 者 行 在 
目 己 的 房间 ， 直 到 谈话 结束 ， 所 以 每 个 人 都 能 以 合适 的 音量 说 话 ， 
为 声音 传 到 其 他 房间 时 会 减弱 。 但 如 果 我 们 把 房间 看 成 单元 ， 这 了 束 好 
比 每 个 单元 每 次 只 允许 有 一 个 连接 。 考 虑 到 客人 数量 很 可 能 比 房 间 数 
多 ， 这 种 安排 将 无 法 令 许多 没有 分 配 到 房间 的 谈话 者 满意 。 
为 了 处 理 这 个 容量 问题 ， 主 人 决定 允许 许多 谈话 者 共用 一 个 房间 
( 即 每 单元 多 人 ) ， 让 每 对 谈话 者 在 不 同 的 时 间 交 谈 。 因 此 ， 在 任何 
指定 房间 里 ， 第 一 对 谈话 者 可 能 有 30 秒 交谈 ， 此 时 其 他 人 保持 沉默 ， 


然后 是 下 一 组 ， 以 此 类 推 。 同 样 ， 每 个 人 都 可 以 尽情 地 大 声 说 话 ， 因 
为 声音 不 会 盖 住 别人 的 谈话 。 这 是 TDMA 的 一 个 例子 ， 在 每 个 房间 
里 ， 每 段 谈话 都 被 分 配 到 一 个 单独 的 时 段 。 


如 果 不 是 分 配 时 段 ， 假 设 主人 让 每 个 房间 里 的 每 对 谈话 者 使 用 一 
i] 单独 的 语言 。 那 么 ， 大 家 都 可 以 同时 说 话 ， 因 为 每 对 谈话 者 只 能 听 
到 一 门 特定 的 语言 。 这 是 CDMA 系 统 的 一 个 例子 ， 每 种 语言 代表 一 个 
不 同 的 代码 ( 见 图 1-10) 。 但 是 人 类 语言 并 不 是 完美 的 代码 。 此 外 ， 
音量 控制 是 一 个 问题 ， 因 为 在 房间 里 的 每 个 人 都 可 以 听 到 其 他 所 有 谈 
话 ， 无 论 是 用 什么 语言 。 我 们 需要 一 些 协调 ， 使 个 人 根据 彼此 之 间 的 
距离 ， 调 整 目 己 的 首 量 。 


图 1-10 
注 : 利用 CDMA 技 术 ， 每 个 代码 就 像 一 门 独 立 的 语言 。 在 鸡尾酒 会 的 比喻 中 ， 如 果 人 们 使 用 
不 同 语言 说 话 ， 多 个 谈话 就 可 以 在 一 个 房间 内 进行 。 然 后 ， 问 题 就 变 成 如 何 控制 音量 


控制 功率 电 平 


CDMA 也 有 目 己 的 问题 。 我 们 现在 将 探讨 它 的 倡导 者 在 20 世 纪 90 
年 代 初 必须 克服 的 一 些 主要 问题 。 


远近 问题 


不 同 信号 在 同一 时 间 传 输 ， 必 然 会 产生 干扰 (interference) 。 
当 你 考虑 到 和 基站 的 距离 时 ， 问 题 会 变 得 更 复杂 。 一 个 离 基站 一 英里 
远 的 人 打 电 话 ， 怎 么 能 不 被 一 个 距离 只 有 几米 远 的 人 干扰 ? 这 个 人 所 
在 的 位 置 不 仅 信 号 更 弱 ， 而 且 也 可 能 有 更 多 的 物体 (如 树木 ) 阻碍 信 
号 的 路 径 。 这 就 导致 了 不 同 水 平 的 信道 质量 (channel quality) ， 
如 图 1-11 所 示 。 
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图 1-11 
注 : 发 射 器 离 接收 器 越 远 ， 信 和 号 越 弱 ， 阻 挡 传 输 通 道 的 物体 也 可 能 越 多 。 在 图 中 ，A 离 发 射 
塔 距离 近 且 没有 被 阻挡 ， 而 B 离 发 射 塔 距离 远 且 受到 物体 阻挡 (例如 树木 ) 

我 们 在 这 里 所 描述 的 问题 称 为 远近 问题 (near-far 
problem) 。 要 处 理 该 问题 ， 我 们 的 手机 需要 某 种 机 制 ， 以 便 它 可 以 
调整 传输 能 力 ， 以 弥补 信道 质量 的 差异 ， 使 我 们 能 够 有 效 地 共享 空 
间 。 


为 了 缓解 该 问题 ， 最 初 提出 的 解决 方案 是 传输 功率 控制 
(transmi-ssion power control， 简 称 TPC) 算法 。 该 算法 试图 平 
衡 接收 到 的 信号 功率 。 基 站 会 测量 从 每 个 发 射 絮 接收 的 数据 ， 将 其 与 
所 需 功 率 进 行 比较 ， 并 癌 每 台 设 备 发 送 反 馈 消 妃 ， 使 其 进行 相应 的 调 
于 。 


如 何在 接收 器 测量 功率 ? 功率 的 标准 单位 是 瓦特 (W) ， 表 示 
每 秒 发 射 的 能 量 数 。 所 以 ，5 W 意 味 着 每 秒 钟 传输 的 能 量 为 5 个 单位 。 
在 本 章 中 ， 我 们 通常 讨论 的 功率 等 级 是 一 瓦特 的 若干 部 分 ， 为 毫 瓦 
(mW) ， 即 千 分 之 一 瓦特 ， 或 微 瓦 rw) ， 即 百 万 分 之 一 瓦特 。 


回 到 TPC 算 法 。 假 设 塔 上 所 需 的 功率 电 平 为 10 宣 瓦 。 如 图 1-12 所 
示 ， 手 机 A 和 手机 B 开 始 以 此 功率 发 送信 号 ， 基 站 接收 到 的 功率 分 别 为 
5 训 瓦 和 1 毫 瓦 。 信 道 衰 减 导致 A 的 功率 减 半 ，B 的 功率 减少 到 1/10。 为 
了 扭转 这 一 局 面 ，TPC 要 求 发 射 句 分 别 以 目前 传输 功率 的 2 倍 和 10 倍 传 
输 信 号 。 这 意味 着 ，A 应 该 以 2x10 豪 瓦 =20 训 瓦 的 功率 传输 ， 而 B 应 该 
以 10x10 毫 瓦 =100 毫 瓦 的 功率 传输 。 


| 
Ta 


SN DA AN 


/NN 

10 mW ImW WE 

= 一 一 一 一 一 一 一 一 一 一 一 一 一 > AAN 

B WX 

(] (10/1) x 10 = 100 ,| 
< 


A 
2 1 


以 100 mW 的 功率 传输 


~ 


2 


图 1-12 传输 功率 控制 算法 示例 
一 般 来 说 ，TPC 算 法 基于 以 下 方程 : 


下 次 切 率 =“ 系数 "x 当 前 功率 


其 中 “系数 ”等 于 所 需 功 率 (示例 中 为 10 毫 瓦 ) 除 以 所 接收 功率 (5 
毫 瓦 和 1 毫 瓦 ) 。 


质量 不 只 是 功率 


有 了 TPC， 束 可 以 通过 增加 相应 传输 ， 来 平衡 接收 信和 号 功率 。 这 
是 否 足 以 保证 “ 民 好 的 接收 ? 呢 ? 不 一 定 。 接 收 到 的 信号 也 会 受到 来 目 
其 他 手机 的 干扰 。 你 可 以 在 图 1-13 中 看 到 演示 。 即 使 连接 A 的 发 射 功 
率 很 高 ， 如 果 来 自 其 他 发 射 器 (链接 B) 的 干扰 也 很 高 ， 那 么 A 接收 到 


的 信号 质量 仍然 可 能 低 。 这 是 我 们 第 一 次 看 到 网 络 的 影响 ， 在 这 种 情 
况 下 ， 受 到 影响 的 十 使 用 相同 通信 介质 的 多 个 用 户 。 
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注 : 理想 情况 下 ， 只 有 同一 个 发 射 器 发 出 的 信号 才 会 进入 其 接收 器 。 但 事实 并 非 如 此 : 图 
中 ， 一 些 A 的 传输 信号 将 被 一 同 带 入 B 的 接收 器 ， 1 


对 于 移动 通信 ， 我 们 需要 平衡 的 通 第 是 质量 ， 而 不 是 功率 。 那 
么 ， 如 何 确定 接收 到 的 信号 质量 呢 ? 我 们 可 以 结合 三 个 因素 来 考虑 : 


1. 从 目标 发 射 器 接收 到 的 信号 功率 。 这 是 接收 器 试图 接收 的 发 
射 器 。 


2. 从 非 目 标 〈 即 干扰 ) 发 射 器 接收 的 信号 功率 。 这 些 是 接收 器 
斋 望 驮 避 的 发 射 郁 


3. 接 收 亏 噪 声 ， 这 征 所 有 接收 亏 固 有 的 问题 。 


衡量 质量 可 以 用 积极 因素 (第 1 点 ) 除 以 消极 因素 (第 2、3 点 ) 。 
这 被 称 为 信号 干扰 比 (signal-to-interference ratio ， 简 称 
SIR) 。 


避免 “军备 竞赛 


相 比 于 实现 目标 功率 ， 实 现 目 标 信号 干扰 比 更 复杂 ， 因 为 我 们 不 
能 仅 靠 增 加 发 射 功率 来 同时 达到 所 需 的 信号 干扰 比 。 增 加 A 的 传输 功 
率 会 增加 A 的 信和 号 干扰 比 ， 但 也 会 导致 其 他 连接 的 信号 干扰 比 减 少 。 
这 样 我 们 束 必 须 增加 其 他 发 射 万 的 功率 ， 以 提高 它们 的 信号 干扰 比 ， 
不 过 这 将 影响 到 其 他 所 有 人 ， 伺 使 他 们 增加 发 射 功率 。 以 此 类 推 ， 其 
结果 必然 是 一 场 “军备 苋 赛 *， 最 终 ， 以 最 噩 功 率 传输 的 一 方 将 获胜 。 
但 这 不 古 一 种 非常 有 效 的 分 至 方式 。 


如 果 每 台 移 动 设备 都 确定 一 个 理想 的 信号 干扰 比 ， 古 否 有 可 能 找 
到 一 组 传输 功率 ， 能 同时 达到 所 有 的 目标 ? 答案 是 肯定 的 ， 只 要 理想 
的 信号 干扰 比 是 可 行 的 (feasible) ， 或 彼此 兼容 的 。 换 名 话说， 不 
能 所 有 人 都 希望 实现 高 得 不 切实 际 的 信号 干扰 比 。 


该 解决 方案 被 称 为 分 布 式 功率 控制 〈distributed power 
control) ， 简 称 DPC。 它 的 工作 原理 是 : 


1 每 台 设 备 最 初 具有 一 定 的 初始 传输 功率 。 
2. 接收 器 测量 每 台 发 射 器 的 信号 干扰 比 。 
3. 基于 目标 和 测量 信号 干扰 比 的 比值 ， 每 台 发 射 器 调整 其 功率 
电 平 。 


4. 根据 需要 重复 步 又 2 和 3 。 


不 同 于 之 前 讨论 的 、 单 一 步骤 的 远近 传输 功率 控制 算法 ， 分 布 式 
功率 控制 是 一 种 迭代 (iterative) 算法 ， 它 是 不 断 反复 的 。 鉴 于 目标 
言 号 干扰 比 是 可 行 的， 事实 证 明 ， 分 布 式 功率 控制 算法 会 收敛 
(converge) ， 这 意味 着 ， 信 号 干扰 比 对 应 的 功率 电 平 将 停止 更 
新 。 事 实 上 ， 这 些 收敛 的 功率 电 平 也 将 是 最 佳 (optimal) 的 ， 因 为 
它们 将 使 用 最 少 的 能 量 。 


分 布 式 功率 控制 工作 原理 


如 图 1-14 所 示 ， 假 设 在 一 个 单元 里 有 三 台 移 动 站 : A、B 和 C。 图 
中 实 线 表示 每 对 发 射 器 和 接收 器 上 行 连接 的 直接 信道 增益 (channel 
gains) 。 信 道 增益 衡量 功率 放大 (amplified) 多 少 ， 或 者 出 于 实 
际 目的 ， 表 示 从 信号 源 到 目的 地 功率 增强 了 多 少 (由 于 它们 是 分 数 ， 
因此 所 谓 增 强 其 实 是 衰减 ) 。 直 接 信道 增益 应 该 尽 可 能 高 ， 因 为 它 代 
表 了 预期 的 通话 。 与 此 相反 ， 虚 线 代 表 干 扰 信 道 增益 ， 也 就 是 由 于 某 
些 因 素 ， 非 预期 信号 将 灶 合 到 各 个 接收 器 。 你 可 以 在 表 1-1 和 表 1-? 中 
看 到 信道 增益 、 目 标 信号 干扰 比 和 接收 器 噪声 示例 (图 中 数字 是 为 了 
进行 说 明 ， 并 不 代表 通常 在 蜂窝 网 络 中 观察 到 的 实际 数字 ) 。 
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图 1-14 三 台 移 动 站 与 基站 之 间 的 信道 


注 ， 实 线 表示 直接 信道 增益 ， 而 虚线 表示 干扰 信道 增益 
表 1-1 分 布 式 功率 控制 示例 的 信道 增益 


发 射 器 接收 器 
A B & 
A 0.9 0.1 0.2 
0.1 0.8 0.2 
@ 0.2 0.1 0.9 


表 1-2 分 布 式 功率 控制 示例 的 所 需 信 号 干扰 比 和 噪声 参数 


链接 目标 信号 干扰 比 噪声 ( 毫 瓦 ) 


A 1.8 0.1 
2.0 0.2 
GC 2 0.3 


让 我 们 举例 说 明 分 布 式 功率 控制 算法 的 前 几 步 计算 。 为 了 更 新 发 
送 功率 ， 分 布 式 功率 控制 算法 采用 了 一 个 类 似 于 之 前 传输 功率 控制 算 
法 方程 的 直观 方程 ， 但 它 只 涉及 信号 干扰 比 而 不 是 信道 质量 。 对 于 每 
一 台 发 射 髓 而 言 ， 其 更 新 率 为 : 


下 次 功率 = 系数 "x 当前 功率 
其 中 < 系数 "为 目标 信号 干扰 比 除 以 测量 信号 干扰 比 的 比值 。 


这 个 更 新 是 相当 合乎 逻辑 的 。 如 果 测 得 的 信号 干扰 比 低 于 所 需 信 
号 干扰 比 ， 那 么 “系数 "将 大 于 1。 为 了 平衡 它们 ， 传 输 功 率 将 增加 。 相 
反 ， 如 采 测 得 的 信号 干扰 比 高 于 所 需 , “系数 "将 低 于 1， 传 输 功 率 将 降 
低 。 发 射 器 便 可 以 使 用 更 少 的 能 量 ， 同 时 此 举 将 有 助 于 改善 其 他 发 射 
亏 的 信号 干扰 比 。 最 后 ， 如 采 测 得 的 信号 干扰 比 和 所 需 的 一 样 ,“ 系 
数 " 将 是 1， 发 送 功率 将 保持 不 变 。 如 采 目 标 已 经 实现 ， 则 没有 必要 做 
出 改变 。 


为 什么 这 样 的 更 新 是 有 必要 的 ? 在 一 个 单元 中 ， 每 台 设备 对 其 他 
设备 施加 负 外 部 性 (negative externality) ， 对 其 进行 干扰 。 换 名 
话说 ， 在 实现 自身 目标 的 同时 ， 每 台 设备 还 会 对 网 络 的 其 余部 分 造成 
一 些 “ 损 害 ”。 此 更 狐 对 设备 保持 控制 : 每 当 信号 干扰 比 高 于 所 需 水 
平 ， 功 率 电 乎 便 会 下 降 ;， 当 信和 号 干扰 比 太 低 时 ， 功 率 电 乎 便 会 提高 。 


基站 和 设备 之 间 进 行 “ 信 息 传 递 ”， 以 纠正 这 种 偏差 的 过 程 ， 是 一 
个 负 反 馈 negative feedback) 的 例子 ( 见 图 1-15) 。 它 迫使 发 身 
器 内 化 其 负 外 部 性 ( 即 为 其 造成 的 干扰 付出 代价 ) ， 按 照 规则 弥补 对 
系统 造成 的 附加 干扰 。 


我 们 在 本 书 中 讨论 不 同 网 络 时 ， 负 反馈 和 人 负 外 部 性 的 概念 会 反复 

出 现 。 更 普 遇 的 是 ， 负 反馈 是 一 种 在 系 统 中 保持 平衡 

(equilibrium) 的 方式 ， 它 会 对 输出 过 程 中 的 波动 进行 检查 和 平 
衡 。 使 系统 偏离 平衡 的 正 反馈 也 会 在 后 面 提 到 。 
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图 1-15 
注 : 信号 塔 告诉 每 台 设 备 其 当前 接收 到 的 信号 干扰 比 ， 它 将 充当 负 反 馈 信 号 。 利 用 该 信号 ， 
每 台 设备 可 以 独立 更 新 其 传输 功率 
回 到 我 们 的 例子 。 在 分 布 式 功率 控制 方程 所 需 的 所 有 数量 中 ， 我 
们 知道 所 需 的 信号 干扰 比值 ( 表 1-2) ， 当 前 的 发 射 功 率 可 以 设 为 2 毫 
瓦 ， 那 就 只 剩 下 测量 信号 干扰 比 了 。 对 于 每 个 链接 ， 我 们 可 以 这 样 计 
算 ; 


信号 
测量 信号 干扰 比 了 
干扰 + 噪声 


我 们 如 何 得 到 “信和 号”*”、“ 干 扰 " 和 “噪声 ”的 数值 ?从 链接 A 开始 : 


。 信 号 : 从 发 射 器 A 到 接收 器 A 的 直接 增益 ， 乘 以 发 射 功率 。 在 
表 1-1 中 ， 它 是 0.9x2 毫 瓦 = 1.8 毫 瓦 。 

。 干 扰 : 从 其 他 发 射 器 到 接收 器 A 的 间接 增益 的 总 和 ， 乘 以 它 
们 的 传输 功率 。 在 表 1-1 中 ， 我 们 看 第 一 列 : 从 B 到 A， 增 益 为 
0.1， 从 C 到 A 是 0.2。 因 此 干扰 值 为 0.1x2 写 瓦 + 0.2x2 训 瓦 = 0.6 写 


. 噪声 ， 这 是 接收 器 噪声 ， 如 表 1-2 所 示 ， 链 接 A 的 噪声 为 0.1 


在 现实 中 ， 接 收 秀 甚至 不 需要 做 乘法 和 加 法 计算 ， 因 为 它 可 以 实 
际 测量 信号 干扰 比 。 


因此 ， 链 接 A 的 测量 信号 干扰 比 为 : 


1.8 1.8 
0.6+01 07 A 


链接 B 怎 么 样 呢 ? 从 发 射 器 B 到 接收 器 B， 和 直接 增益 为 0.8 毫 瓦 ， 所 
以 信号 功率 为 0.8x2 训 瓦 =1.6 宫 瓦 。 间 接 增益 来 自发 射 器 A 和 C: 从 A 到 
B， 增 益 为 01， 从 C 到 B 也 是 0.1。 这 意味 着 干扰 功率 为 0.1x2 训 瓦 
+0.1x2 豪 瓦 = 0.4 上 毫 瓦 。 最 后 ， 链 接 B 的 接收 器 噪声 为 0.2 上 毫 瓦 。 因 此 ， 
链接 B 的 测量 信号 干扰 比 是 1.6/0.6 = 2.67。 


使 用 相同 步骤 ， 可 以 得 出 链接 C 的 信号 干扰 比 为 ; 
0.9x 2 We 
O07 Tox as ll 


让 我 们 把 这 些 值 和 所 需 信号 干扰 比 进行 比较 。 对 于 链接 A， 所 需 
的 值 为 1.8， 所 以 测量 信号 干扰 比 偏 高 ， 高 出 2.57-1.8 = 0.77。 同 样 ， 
链接 B 的 测量 信号 干扰 比 偏 高 ， 遍 出 2.67-2.0 = 0.67， 而 链接 C 的 测量 
言 号 干扰 比 偏 低 ， 低 了 2.2-1.64 = 0.56。 


我 们 现在 可 以 使 用 DPC 方程 计算 新 的 功率 电 平 。 系 数 是 多 少 ? 我 
们 用 每 个 链接 的 目标 信号 干扰 比 除 以 测量 信号 干扰 比 : 1.8 / 2.57 = 
0.70，2.0/2.67 = 0.75， 以 及 2.2 /1.64 = 1.34。 正 如 预期 的 那样 ， 链 接 
A 和 B 的 比值 小 于 1 (测量 值 太 高 ， 链 接 C 的 大 于 1 (测量 值 太 低 ) 。 
有 了 这 些 值 ，A、B 和 C 的 下 一 个 功率 电 平 分 别 为 : 


0.70 x 2 至 拟 = 1.40 训 瓦 
0.75 x 2 坚 瓦 = 1.50 毫 瓦 
1.34 x 2 宣 拟 = 2.68 蝇 瓦 


人 负 反 馈 导 致 A 和 B 的 功率 电 平 降低 ，C 的 增加 ， 正 如 我 们 预期 的 那 
样 。 


下 一 步 是 什么 ? 用 本 书 的 方程 来 计算 这 些 新 功率 电 平 的 信号 干扰 
比 。 之 后 呢 ? 基于 更 新 方程 ， 调 整 功率 电 平 。 后 面 步 又 的 计算 以 同样 
的 方式 进行 。 如 有 果 你 想 看 到 更 多 计算 过 程 ， 请 参考 本 书 网 站 Q1.4 部 


DPC 算 法 的 30 次 迭代 的 传输 功率 和 信号 干扰 比 水 平 都 标注 在 图 1- 
16 中 。 大 约 10 次 迭代 后 ， 我 们 不 再 能 看 到 两 者 数量 有 明显 的 变化 ， 这 
表明 DPC 算 法 已 收敛 到 平衡 。 测 量 信 号 干扰 比 已 经 达到 目标 值 1.8、2.0 
和 2.2， 功 率 电 平分 别 为 1.26、1.31 和 1.99 豪 瓦 。 


为 什么 链接 C 的 功率 电 平 比 其 他 两 者 高 得 多 ? 它 具 有 所 有 接收 着 
中 最 高 的 噪声 成 分 《0.3 豪 瓦 ) ， 从 其 他 链接 获得 的 最 高 干扰 增益 (两 


者 均 为 0.2) ， 以 及 所 有 链接 中 最 高 的 目标 信号 干扰 比值 (2.2) 。 它 需 
要 更 高 的 传输 功率 来 区 服 这 些 缺 点 。 


为 什么 算法 会 收敛 ? 由 于 测量 信号 干扰 比 和 目标 信号 干扰 比 相 
等 ， 更 痢 方 程 中 的 “系数 "将 成 为 1， 所 以 功率 不 会 再 改变 。 负 反馈 使 网 
络 取得 平衡 ， 使 设备 进行 有 效 共 译 。 它 将 你 持 这 种 状态 ， 直 到 网 络 改 
变 ， 比 如 当 设 备 的 干扰 条 件 改变 ， 一 台新 设备 进入 单元 ， 或 现 有 设备 
离开 单元 。 


图 1-16 
注 : 图 为 算法 30 次 迭代 的 发 射 功率 (上 图 ) 和 信和 号 干扰 比 (SIR) 水 平 (下 图 ) 


在 一 个 真正 的 单元 里 ， 可 能 有 上 百 台 电话 ， 随 着 通话 开始 和 结 
束 ， 以 及 人 们 从 一 个 位 置 移动 到 另 一 个 位 置 ， 可 以 想象 从 链接 到 链接 
的 信道 条 件 和 信号 干扰 比值 会 迅速 改变 。 其 结果 是 ， 需 要 实现 高 达 每 
秒 1 500 次 的 功率 控制 。DPC 算 法 的 一 个 好 处 是 ， 每 台 设 备 不 需要 了 解 
其 他 链接 如 何 运行 。 要 计算 下 一 个 功率 电 平 ， 所 需要 的 只 是 它 的 当前 


传输 功率 、 目 标 信号 干扰 比 和 当前 测量 信号 干扰 比 。 这 些 都 是 其 自身 
的 参数 ， 并 且 它 会 独立 做 出 目前 的 决定 (例如 ， 设 备 不 需要 知道 任何 
其 他 链接 的 信号 干扰 比 ) 。 这 人 允许 每 台 设 备 在 内 部 执行 计算 ， 而 不 需 
要 与 其 他 设备 共享 信息 。 换 句 话说 ，DPC 是 一 个 完全 分 布 式 
(distributed) 的 算法 ( 见 图 1-17) ， 而 不 是 我 们 后 面 会 见 到 的 更 
为 集中 式 (centralized) 的 算法 (如 第 5 章 谷歌 的 网 页 级 别 ) 。 


传输 传输 

更 新 "i 更 新 

Ny 

We 

测量 信号、 
更 新 更 新 
更 新 :“ 系 数 ”x 当前 功率 
图 1-17 


注 : 分 布 式 功率 控制 是 一 种 完全 分 布 式 算 法 
CDMA 标 准 


提出 DPC 算 法 ， 是 为 了 处 理 CDMA 干 扰 问 题 。 即 使 有 了 这 样 的 发 
展 ， 也 是 在 现实 的 网 络 条 件 下 ， 经 过 数 次 全 美 范围 的 大 规模 试验 演示 
后 ， 它 才 得 到 了 各 大 网 络 运 营 商 的 支持 。 


最 终 ，CDMA 于 1993 年 被 批准 为 IS-95 标 准 下 的 2G 蜂 帘 标 准 ， 其 
品牌 为 cdmaOne。 三 年 后 ，CDMA 在 美国 的 第 一 次 大 规模 的 商业 部 署 
由 Sprint PCS 完 成 虽然 TS-95 已 经 基本 升级 为 3G 标 准 ， 但 该 标准 及 其 
直接 修改 版 本 仍然 只 在 世界 部 分 地 区 使 用 。 


向 上 升 ， 向 前 进 : 3G、4G 及 其 他 


几 十 年 来 ， 移 动 入 网 数量 剧 增 。 仅 美国 ， 移 动 入 网 数量 就 从 1985 
年 的 大 约 340 000 增 长 到 2015 年 的 327 000 000，30 年 中 增长 了 近 1 000 
倍 。 自 2011 年 以 来 ， 美国 的 移动 电话 渗透 率 已 经 超过 了 100%。 


进入 21 世 纪 ，3G 手 机 在 全 世界 迅速 普及 。 国 际 电 信 联 盟 (ITU) 
于 2000 年 发 布 3G 技 术 规 范 ， 本 质 上 束 是 要 求 手机 像 掌上 电脑 一 样 工 
作 : 除了 打 电 话 和 发 短信 ， 手 机 还 具备 上 网 、 视 频 通 话 、 移 动 电视 的 
功能 。 目 前 两 大 主要 的 3G 标 准 分 别 是 用 在 欧洲 、 日 本 和 中 国 的 UMTS 
(通用 移动 通信 系统 ) ， 以 及 用 于 美国 和 韩国 的 CDMA2000 〈 码 分 多 
址 ) 。 这 两 种 技术 都 基于 CDMA， 通 常 被 部 署 在 1.9~2.1 GHz 的 频率 范 
围 内 。 


截至 2015 年 年 初 ， 世 界 上 大 约 70% 的 人 口 被 至 少 一 个 3G 网 络 履 
盖 。 这 一 数字 在 2012 年 年 初 是 50%。 据 预测 ， 到 2020 年 ， 世 界 上 超过 
4/5 〈 即 80% 以 上 ) 的 人 口 将 可 以 使 用 3G 网 络 ， 这 将 使 其 几乎 无 处 不 
在 。 有 关 智 能 手机 如 何 出 现 的 信息 ， 请 参考 本 书 网 站 Q1.5 部 分 。 


目 从 1G 网 络 在 20 世 纪 80 年 代 实 现 商业 化 以 来 ， 大 约 每 10 年 就 有 新 
一 代 的 蜂 帘 网 络 出 现 。 按 照 这 一 速度 ，4G 网 络 性 能 要 求 在 2008 年 被 提 
出 ， 与 之 前 的 3G 规 范 相 比 ， 它 提出 更 高 的 速度 和 能 力 要求 。 此 后 出 现 
的 主要 标准 是 长 期 演进 (ong-term evolution) ， 简 称 LTE。LITE 没 有 使 


用 CDMA 技 术 ， 而 是 基于 正 交 频 分 复 用 (orthogonal frequency 
division multiplexing) 技术 ， 简 称 OFDM 。 


在 美国 ， 第 一 台 LITE 智 能 手机 出 现在 2011 年 年 克 。2015 年 年 初 ， 
世界 上 大 约 25% 的 地 区 覆盖 了 4G 网 络 ， 并 且 预 计 到 2020 年 ，4G 网 络 履 
盖 率 将 增加 到 60% 以 上 。2017 年 ，4G 相 对 于 3G 的 性 能 改进 有 望 吸 引 10 
亿 用 户 。 虽 然 截 至 2016 年 ，4G 网 络 上 履 盖 范围 小 于 3G 网 络 ， 但 它 正 以 更 
快 的 步伐 部 署 着 。 


蜂 二 网 络 的 发 展 历程 ， 完 美 诠释 了 多 年 来 网 络 如 何 尽 力 满足 消费 
者 对 性 能 的 需求 这 一 问题 。 不 同 的 共 至 方法 ， 无 论 是 频率 、 时 间 还 是 
基于 代码 的 无 线 网 ， 都 被 开发 出 来 以 实现 这 个 目标 。 虽 然 我 们 并 不 知 
道 这 其 中 涉及 的 过 程 ， 但 对 于 蜂 贷 网 络 的 运行 而 言 ， 实 时 更 新 和 管理 
我 们 通话 的 功率 征 必 不 可 少 的 。 找 到 正确 的 共生 方法 很 困难 ， 但 也 非 
党 重要 。 


分 布 式 功 率 控 制 说 明了 几 个 在 网 络 发 展 和 本 书 中 经 第 出 现 的 主 
题 : 仙人 反馈 、 系 统 平衡 ， 以 及 分 布 式 协调 。 它 也 说 明了 我 们 将 反复 看 
到 的 以 下 主要 观点 : 允许 每 个 用 户 出 于 目 身 利益 做 出 独立 的 决定 ， 可 
以 在 所 有 用 户 间 累积 到 一 种 公平 而 有 效 的 状态 。 


在 下 一 革 ， 我 们 将 转 同 Wi-Fi， 这 是 男 一 种 类 型 的 无 线 网 络 。 随 之 
而 来 的 古 和 蜂 久 不 同 的 共享 模式 ， 不 同 于 运用 严格 的 功率 控制 算法 ， 
Wi-Fi 依 靠 随机 访问 管理 在 同一 地 点 的 用 户 之 间 的 干扰 。 


1. 1 英里 s*1.609 千 米 。 一 -一 编者 注 
2. 于 兆赫 也 称 “ 吉 赫 ”。 编者 注 


第 2 章 
“随意 地 ”访问 网 络 


到 20 世 纪 90 年 代 中 期 ， 第 二 代 蜂 窝 网络 已 经 在 全 志 界 普及 。 两 种 
相互 竞争 的 技术 一 ”TDMA 和 CDMA， 都 急需 网 络 容 量 有 所 改进 。 


大 约 在 这 个 时 候 ， 工 程 师 们 开始 思考 ， 是 否 能 找到 一 个 完全 不 同 
的 方法 来 共 诗 空间 。 他 们 在 这 个 方 同 上 的 努力 带 来 了 Wi-Fi 技 术 的 发 
明 。 


交通 信号 灯 与 俘 车 标志 


目 先 ， 让 我 们 做 一 个 天 于 汽车 交通 的 简单 比喻 ， 说 明 共 至 Wi-Fi 如 
何不 同 于 共 至 蜂 久 网 络 。 


假设 你 正在 开车 ， 开 到 一 个 十 字 路 口 ， 如 图 2-1 所 示 。 如 果 十 字 路 
口 由 交通 信号灯 控制 ， 那 么 当 绿灯 亮 起 时 ， 十 字 路 口 则 专门 对 你 所 在 
的 一 侧 开 放 。 这 类 似 于 将 时 间 、 频 率 或 代码 分 配给 通话 者 ， 回 其 开放 
在 蜂 镶 网络 中 的 通话 时 间 。 


图 2-1 


注 ， 蜂 窜 和 Wi-Fi 共 享 资源 的 主要 区 别 类 似 交 通信 号 灯 和 停车 标志 之 间 的 差异 。 当 流量 很 小 
时 ， 停 车 标志 (Wi-Fi) 更 有 效 ， 但 当 汽车 数量 (设备 ) 增加 时 ， 它 们 是 不 可 扩展 的 。 在 这 些 
情况 下 ， 我 们 倾向 于 使 用 交通 信号 灯 (蜂窝 ) ， 每 次 只 向 一 侧 开放 路 口 (资源 ) ， 以 调节 交 
通 流 量 

只 要 马路 男 一 侧 有 和 车辆， 红 灯 束 有 意义 。 但 要 是 你 被 挡 在 红 灯 
前 ， 另 一 侧 却 没有 来 往 车 辆 呢 ? 这 似乎 相当 浪费 《而且 十 分 令 人 诅 
形 ) 。 你 为 什么 不 能 开车 通过 呢 ? 在 这 种 情况 下 ， 停 车 标志 会 是 一 种 
调节 交通 的 更 有 效 的 方式 。 当 我 们 接近 停车 标志 时 ， 停 下 来 看 看 两 
侧 ， 如 果 没 有 人 就 继续 前 行 。 我 们 只 需要 一 种 协调 方式 〈 停 下 来 看 
看 ) ， 来 尽量 减少 发 生意 外 的 概率 。 


有 了 停车 标志 后 ， 束 不 会 再 让 某 些 车 辆 至 用 专用 路 口 ， 而 是 只 要 
大 家 遵循 随机 访问 的 规划， 就 可 以 共 至 路 口 。 当 交通 流量 小 而 可 变 
时 ， 这 种 方法 更 加 有 效 。 停 车 标志 类 似 于 Wi-Fi 的 工作 方式 : 没有 专门 


的 资源 ， 而 是 让 设备 在 传输 前 先 “ 昕 ”( 即 “两 边 看 ”) ， 以 防止 它 与 其 
他 设备 发 生 碰撞 。 


但 随 着 交通 量 的 增加 ， 停 车 标志 就 成 为 问题 。 当 连接 线路 建立 起 
来 时 ， 车 辆 依次 “ 集 " 和 “ 走 ” 的 性 质 会 导致 非常 长 的 等 每 时 间 ， 特 别 钙 
当 男 一 侧 没 有 停车 标志 时 。 在 这 种 情况 下 ， 交 通信 号 灯 的 专用 性 质 可 
能 成 为 首选 。 正 如 我 们 将 看 到 的 ，Wi-Fi 也 有 类 似 的 问题 ， 随 着 设备 数 
量 增加 ， 其 性 能 会 大 幅 下 降 。 


Wi-Fi 的 产生 和 演化 


如 果 我 们 可 以 建立 小 型 站 点 ， 为 芝 边 移动 不 快 的 人 提供 无 线 互 联 
网 连接 呢 ? 这 种 观点 构成 了 Wi-Ei 的 基础 ， 如 图 2-2 所 示 。 它 利用 了 随 
机 访问 提供 的 优势 。 


注 ， Wi-Fi 为 接近 接 入 点 的 设备 (如 笔记 本 电脑 、 手 机 和 平板 电脑 ) 提供 无 线 连 接 


1985 年 ， 美 国联 邦 通信 委员 会 同 公众 开放 了 一 些 频段 。 不 同 于 通 
信 公 司 必须 购买 昂 贯 的 许可 证 来 经 育 的 蜂 贷 频段 ， 任 何人 都 可 以 使 用 
这 些 频段 〈( 只 要 他 们 遵循 某 些 规则 ) 。 这 些 频段 频率 约 为 2.4GHz 和 5.8 
GHz， 被 称 为 工业 、 科 学 和 医疗 频段 (简称 ISM) 。 工 程 师 们 抓 住 机 
会 ， 使 用 ISM 频 段 发 展 通信 以 及 后 来 的 Wi-Fi。 他 们 也 将 其 用 于 其 他 目 
的 。 事 实 上 ， 如 今 最 第 见 的 ISM 设 备 十 微波 炉 ， 因 为 这 些 频 率 刚好 能 
很 好 地 濑 发 水 分 子 。 


由 于 美国 电气 及 电子 工程 师 学 会 (IEEE) 想 以 其 标准 的 方案 来 命 
名 ， 所 以 Wi-Fi 的 官方 名 称 被 定 为 IEEE 802.11。“802” 轩 对 局 域 网 ， 
表示 它 是 短 距 离 的 ，“.11” 表 示 无 线 局 域 网 。 更 为 吸引 人 的 名 字 Wi- 
Fi， 是 “无 线 保 真 ”(wireless fidelity) 的 简称 ， 它 从 被 发 明 后 一 直 沿 用 


至 今 。 


由 于 不 同 机 构 都 在 发 展 Wi-Fi 技 术 ， 在 声称 使 用 Wi-Fi 的 产品 之 
间 ， 需 要 一 个 方法 来 确保 其 互 操 作 性 。 出 于 这 一 目的 ，Wi-Fi 联 盟 于 
1999 年 成 立 ， 在 符合 IEEE 802.11 标 准 的 设备 上 张贴 Wi_Fi 标 识 。 


一 碗 字母 汤 


像 蜂窝 技术 一 样 ，Wi_Fi 在 短 时间 内 得 到 显著 改进 。 各 种 升级 大 大 
提升 了 用 户 的 连接 速度 。 如 何 测量 速度 ? 以 每 秒 的 比特 数 (bps) 为 
单位 。 今 天 ， 无 线 上 网 速度 一 般 计 为 数 百 万 bps， 即 Mbps 。 


第 一 套 Wi-Fi 标 准 于 1997 年 颁布 ， 提 供 2 Mbps 的 速度 ， 在 2.4 GHz 
的 频率 范围 运行 。 使 命名 规则 更 加 混乱 的 是 ， 每 次 Wi-Fi 标 准 升级 都 在 
802.11 后 增加 一 个 字母 ， 但 并 未 按时 间 顺 序 进 行 : 


。1999 年 ，802.11b 标 准 颁 布 ， 使 用 2.4 GHz 频段 ， 最 高 传输 速 
度 为 11 Mbps。 同 年 ，802.11a 标 准 颁 布 ， 可 以 在 5 GHz 频 段 中 达到 
54 Mbps 的 传输 速度 。 


日 证 


。2003 年 ，802.11g 标 准将 2.4 GHz 频段 的 最 高 速度 提高 到 54 
Mbps。 

。2009 年 ，802.11n 标 准将 最 高 传输 速度 提高 到 超过 100 Mbps， 
可 以 在 2.4 GHz 和 5 GHz 频 段 运 行 。 

。 最 近 ，802.1lac 标 准 于 2013 年 发 布 ， 预 计 能 在 5 GHz 频段 达到 
超过 1 Gbps (1 000 Mbps) 的 峰值 速度 。 


你 可 以 在 表 2-1 中 看 到 此 进展 的 概要 。 不 过 ， 最 大 额定 速度 只 能 在 
理论 上 达到 。 在 现实 条 件 下 ， 能 超过 宣传 中 的 理想 速度 的 一 小 部 分 就 
很 幸运 了 。 


表 2-1 随 着 时 间 推 移 ，Wi-Fi 标 准 的 发 展 及 其 部 分 特征 


标准 年 份 频率 (GHz) 最 高 额定 速度 (Mbps) 
1997 2.4 2 
b 1999 2.4 11 
a 1999 5 54 
g 2003 2.4 54 
n 2009 2.4&5 450 
ac 2013 2.4&5 1 300 


注 : 表 中 还 有 其 他 的 变化 版 本 没有 列 出 


随 着 传输 速度 提高 ， 人 们 对 Wi_Fi 服 务 的 需求 持续 增加 。 截 至 2011 
年 ， 全 世界 已 经 有 超过 10 亿 人 台 无 线 设 备 被 使 用 ， 并 且 每 年 会 增加 数 亿 
台 。 到 2014 年 ， 这 个 数字 已 经 达到 40 亿 ， 预 计 到 2016 年 年 底 ， 它 将 达 
到 70 亿 。 


Wi-Fi 如 何 部 署 


如 前 所 述 ，Wi-Fi“ 共 至 空 间 ” 的 方法 和 蜂 氏 技术 的 完全 不 同 ， 但 实 
际 上 它们 的 部 署 方式 非常 相似 。 


。 Wi-Fi 网络 中 的 用 户 位 于 一 个 基本 服务 集 (basic service 
set) ， 简 称 BSS (或 扩展 服务 集 extended service set) ， 而 不 
是 单元 内 。 

. 在 每 个 服务 集中 ， 用 户 直 接 通过 接 入 点 (access point， 
简称 AP) 通信 ， 而 不 是 基站 。 


你 可 以 在 图 2-3 中 看 到 Wi-Fi 的 网 络 布局 。 当 设备 搜索 Wi-Fi 连 接 
时 ， 它 会 发 送 消 息 ， 发 现 传输 范围 内 的 接 入 点 。 之 后 ， 你 可 以 在 屏幕 
上 看 到 供 选 择 的 网 络 名 称 列表 。 每 一 个 容易 识别 的 名 称 都 代表 一 个 服 
务 集 ， 通 常 被 称 为 服务 集 标识 符 (service set identifiers) ， 简 称 
SSID。 也 许 你 曾经 一 次 次 失望 地 看 到 ， 一 个 具有 民 好 信号 强度 的 SSID 
旁 有 一 把 锁 ; 如 果 网 络 受 到 密码 保护 ， 你 必须 使 用 密码 验证 身份 ， 设 
备 才 可 以 访问 接 入 点 。 


互联 网 


访问 回程 


接 入 点 接 入 点 接 入 点 
《 L 示 《 以 《 L 


基本 服务 集 基本 服务 集 基本 服务 集 
图 2-3 一 个 典型 的 无 线 网 络 部 署 示意 图 
每 个 接 入 点 通常 会 连接 到 回程 (backhaul) 。 回 程 是 有 线 网 部 
署 ， 通 常 为 以 太 网 (Ethernet) ， 这 是 另 一 个 (也 老 得 多 的 ) IEEE 


802“ 家 族 成 员 ”。 由 此 ， 以 太 网 连接 到 接 入 网 络 ， 并 最 终 提供 Wi_Fi 部 
署 与 互联 网 其 余部 分 之 间 的 连接 。 


为 了 通过 Wi-Fi 网 络 发 送 和 接收 ， 设 备 需 要 做 到 以 下 几 点 。 它 需要 
选择 在 其 范围 内 的 接 入 点， 并 选择 使 用 正确 的 频道 。 当 设备 连接 时 ， 
也 需要 在 设置 其 传输 速度 时 监听 接 入 点 ， 正 因 如 此 ， 传 输 速 度 可 能 根 
据 信 道 条 件 产 生 很 大 变化 。 


如 采 你 对 这 些 过 程 的 更 多 信息 感 兴趣 ， 请 参考 本 书 网 站 的 
Q2.1~Q2.3 部 分 。 在 那里 ， 你 也 可 以 找到 Wi-Fi 网 络 部 署 的 更 多 细 市 
(Q2.4~Q2.6) 。 在 本 章 的 其 余部 分 ， 我 们 将 讨论 在 设备 做 到 其 他 事情 


后 要 完成 的 剩余 任务 之 一 : 管理 干扰 。 这 是 共享 的 一 个 重要 部 分 ， 
Wi-Fi 的 方法 和 蜂 窟 技术 完全 不 同 。 


随机 访问 的 方法 


当 两 台 发 射 右 处 于 彼此 干扰 的 范围 内 ， 又 在 相近 的 时 间 发 送信 
号 ， 它 们 的 信号 就 会 碰撞 。 更 确切 地 说 ， 我 们 所 说 的 是 帧 磁 擅 ， 其 中 
一 帧 是 一 个 数字 数据 传输 〈 更 多 信息 见 第 11 章 ) 。 


帧 倍 撞 有 三 种 可 能 的 结果 。 第 一 种 是 最 坏 的 情况 : 两 者 都 丢失 。 

这 意味 着 每 个 帧 的 接收 器 不 能 正确 地 解码 。 第 二 种 是 捕捉 

(capture ) ， 这 意味 着 两 者 中 更 强 的 那个 被 接收 ( 见 图 2 

4) 。*“ 强 ”在 这 里 指 的 是 信号 干扰 比 ， 是 我 们 在 第 1 章 谈 到 的 信号 质量 

衡量 标准 。 第 三 种 是 双重 捕获 (double capture) ， 这 是 最 好 的 情 
况 : 两 者 都 被 恰当 地 接收 。 
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注 ; 当 两 个 Wi-Fi 移 动 站 彼此 接近 ， 并 大 约 在 同一 时 间 发 送 一 个 帧 时 ， 帧 将 会 碰撞 。 由 于 A 比 
B 具 有 较 高 的 信号 干扰 比 ，A 仍 然 有 更 大 的 机 会 被 接收 

那么 ， 哪 一 个 结果 会 占 上 风 呢 ? 这 在 很 大 程度 上 取决 于 几 个 因 
素 。 我 们 采取 保守 的 方法 ， 假 设 最 坏 的 情况 : 每 次 发 生 碰 撞 ， 这 两 帆 
总 是 会 丢失 。 

我 们 在 第 1 章 中 看 到 3G 蜂 宛如 何 管 理 干 扰 : 给 每 个 信号 不 同 的 代 
码 ， 并 使 用 功率 控制 调整 其 强度 。 也 许 我 们 也 可 以 在 这 里 使 用 这 种 方 
法 ? 不 完全 如 此 。Wi-EFi 具 有 一 些 性 质 ， 它 们 使 功率 控制 无 法 成 为 一 种 
有 效 的 解决 方案 。 


首先 ，Wi-EFi 频 段 没 有 经 过 许可 : 由 于 Wi-EFi 频 谱 可 供 任何 人 免费 
使 用 ， 因 此 有 更 多 的 干扰 会 超出 我 们 的 控制 。 男 外 ， 其 单元 规模 小 得 
多 : 在 干扰 条 件 下 ， 将 男 一 个 人 添加 进 服务 集会 造成 很 大 影响 ， 因 为 


一 开始 只 有 少数 几 个 人 。 此 外 ， 它 的 最 大 传输 功率 较 小 ， 由 于 ISM 频 
段 没 有 经 过 许可 ， 我 们 不 能 把 功率 调 得 太 高 。 


如 果 不 能 使 用 功率 控制 ， 那 么 我 们 如 何 处 理 干扰 呢 ? Wi-Fi 采 用 了 
一 种 完全 不 同 的 方法 :一 开始 束 试 图 避免 磁 撞 发生。 


想 想 TDMA (第 1 章 ) ， 其 中 每 个 链接 都 有 自己 的 传输 时 段 。 如 果 
有 三 台 发 射 锅 A、B 和 C， 传 输 顺 序 大 概 会 是 A、B、C、A、B、C 等 。 
我 们 你 证 每 个 用 户 每 轮 都 有 使 用 传输 媒介 的 时 段 。 在 车 辆 交通 的 比喻 
中 ， 这 就 像 交 通信 号 灯 控 制 的 十 字 路 口 ， 一 次 只 允许 一 方 车 辆 通过 。 


对 于 Wi-Fi 来 说 ， 时 间 也 是 相关 维度 。 不 同 于 分 配 专 门 时 段 ，Wi- 
Fi 多 许 设备 在 需要 的 时 候 发 送信 号 ， 只 要 频道 对 其 来 说 是 空闲 的 。 换 
句 话说 ， 它 要 求 设备 一 直 了 解 其 他 设备 的 状态 ， 以 防止 碰撞 。 这 就 像 
司机 来 到 停车 标志 前 ， 他 必须 向 两 侧 看 看 ， 确 保 没有 人 来 ， 然 后 才能 
继续 行驶 。 


这 两 种 技术 都 是 媒体 访问 控制 (medium access control) 的 
方法 。TDMA 是 一 种 专线 访问 形式 ， 而 w-Fi 则 由 随机 访问 


(random access) 控制 。 


我 们 可 以 再 回想 一 下 鸡尾酒 会 的 比喻 〈 见 图 2-5) ， 那 里 客人 的 声 
首 在 空中 此 起 彼 伏 。 当 干扰 声 很 强 时 ， 你 无 法 理解 朋友 想 说 什么 。 
TDMA 束 像 给 客人 分 配 不 同时 间 ， 安 排他 们 在 不 同 的 时 段 说 话 。 随 机 
访问 在 时 间 上 将 客人 分 开 ， 但 不 给 他 们 分 配 时 段 ， 而 是 在 某 个 时 间 ， 
只 要 没有 别人 说 话 ， 吏 允许 某 位 客人 说 话 。 
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尾 酒会 的 比喻 

使 用 随机 访问 时 ， 每 台 设 备 都 需要 遵守 一 定 的 程序 ， 决 定 何 时 发 
送 及 传输 时 间 的 长 度 。 时 段 由 所 有 设备 共享 ， 因 为 它们 可 以 在 需要 时 
尝试 使 用 传输 媒介 ， 只 要 其 目前 没有 人 被 其 他 设备 占用 。 换 句 话 说 ， 
Wi_Fi 协 议 要求 每 台 设 备 遵循 某 种 “礼貌 程序 ”。 该 程序 的 名 称 是 载波 
侦 听 多 址 访问 (carrier sensing multiple access) ， 简 称 CSMA.， 
因为 每 台 设 备 都 试图 “ 侦 听 ”在 频道 中 的 其 他 设备 的 存在 。 


像 第 1 章 中 的 DPC 那样 ，CSMA 是 一 个 完全 分 布 式 的 程序 。 每 台 设 
备 都 使 用 其 通过 目 己 对 频道 的 观察 所 收集 的 信息 在 本 地 执行 ， 它 不 需 
要 某 个 中 央 协 调 器 来 协助 决策 ， 这 是 男 一 个 分 布 式 协 调 成 为 网 络 连 接 
关键 主 题 的 例子 。 


| 


图 2-5 重 回 鸡 


当 设备 数量 较 少时 ，Wi-Fi 可 以 达到 可 观 的 比特 率 。 然 而 ， 随 着 越 
来 越 多 的 设备 开始 争夺 相同 的 接 入 点 ， 速 度 将 大 幅 下 降 。 在 探讨 
CSMA 之 前 ， 让 我 们 思考 一 个 简单 的 随机 访问 协议 ， 以 便 更 加 容易 地 
量化 性 能 如 何 随 着 设备 增加 而 降低 。 


阿 罗 哈 (来 目 夏 威 夷 ) 


如 图 2-6 所 示 ， 有 A、B 和 C 三 台 发 射 器 ， 以 及 DD 和 E 两 个 接 入 点 。 
A 和 B 要 发 送 到 D，C 要 发 送 到 E， 并 且 它 们 都 在 彼此 的 干扰 范围 内 。 


图 2-6 Wi_Fi 拓 扑 示 例 
注 : 两 个 访问 点 D 和 E 的 范围 由 虚线 表示 


在 一 个 时 段 的 开始 ， 每 台 设 备 都 面临 以 下 问题 : 我 应 该 发 送 一 个 
帧 吗 ? 这 个 “决策 "过程 的 部 分 可 能 结果 如 图 2-7 所 示 。 如 果 所 有 的 Wi 
Fi 站 点 (station) 总 是 给 出 肯定 回答 ， 那 冲突 会 一 直 存在 。 这 显然 
是 一 个 不 理想 的 情况 。 站 点 有 时 必须 避免 发 送 ， 以 便 让 其 他 设备 的 数 
据 通过 。 反 过 来 ， 它 应 该 期 待 其 他 设备 会 中 断 发 送 ， 以 便 它 可 以 尽快 
传输 数据 。 


点 6N X 


时 间 


图 2-7 图 2-6 中 站 点 A~C 在 四 个 传输 时 段 的 示例 


注 : 第 三 个 时 段 是 “浪费 的 机 会 "， 因 为 在 此 期 间 没有 设备 传输 


我 们 可 以 通过 许多 不 同 的 因素 来 确定 一 个 站 点 是 否 传输 (例如 ， 
其 最 近 是 否 发 生 了 数据 碰撞 ) 。 如 果 我 们 干脆 在 每 个 时 段 给 它 分 配 一 
个 固定 的 概率 呢 ? 如 果 概 率 是 50%， 那 么 站 点 将 在 一 半 时 间 发 送 ， 另 
一 半 时 间 和 暂停 。 如 果 是 10%， 那 么 它 会 平均 每 10 次 发 送 一 次 ， 并 在 其 
他 9 次 暂停 。 这 种 方法 实际 上 是 阿 罗 哈 (Additive Links On-line 
Hawaii Area， 简 称 ALOHA) 协议 的 基础 ， 它 于 1971 年 由 夏威夷 
大 学 的 诺 曼 : 艾 布 拉 姆 森 发 明 。 (显然 ， 这 个 缩写 并 不 是 巧合 ! ) 


图 2-8 显 示 ， 当 我 们 增加 ALOHA 中 的 传输 概率 时 ， 将 会 出 现 什么 
情况 。 概 率 越 高 ， 发 送 的 帧 越 多 ， 碰 撞 的 可 能 性 就 越 大 。 但 如 果 概 率 
太 低 ， 我 们 又 将 浪费 很 多 机 会 。 问 题 是 ， 哪 个 选择 会 使 吞吐 量 

(throughput) (信息 传递 的 成 功率 ) 尽 可 能 高 呢 ? 


图， 
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注 : 这 是 传输 概率 增加 时 会 出 现 的 情况 

一 切 都 归结 于 吞吐 量 

在 每 个 时 段 中 ， 有 三 种 可 能 的 结果 : (1) 成 功 传输 ( 即 一 个 站 点 
发 送 ) ; ” (2) 碰撞 ( 即 多 个 站 点 同时 发 送 ) ; 《3) 没有 传输 ( 即 没 
有 站 点 发 送 ) 。 在 模拟 吞吐 量 时 ， 第 一 种 情况 对 我 们 最 有 利 。 

有 要 实 现成 功 传输 ， 我 们 需要 满足 两 个 条 件 。 首 先是 有 人 进行 发 
送 。 对 于 任何 一 个 站 点 来 说， 这 一 条 件 发 生 的 概率 惑 是 实现 传输 的 概 


第 二 个 条 件 是 其 他 站 点 不 传输 。 这 个 概率 有 多 大 ? 某 个 站 点 不 传 
输 的 概率 与 其 传输 概率 相对 。 例 如 ， 如 果 传 输 的 概率 为 40%， 那 么 不 
传输 的 概率 为 60%“。 由 于 我 们 需要 所 有 其 他 站 点 不 发 送 ， 那 么 通过 乘 
法 : 其 他 两 个 站 点 不 传输 的 概率 是 0.6x0.6 = 0.36， 或 36%; 其 他 三 个 
站 点 不 传输 的 概率 是 0.6x0.6x0.6 = 0.216， 或 21.6%; 以 此 类 推 。 


那么 ， 一 个 站 点 成 功 传输 的 概率 是 多 少 呢 ? 我 们 用 某 个 站 点 传输 
的 概率 乘 以 所 有 其 他 站 点 不 传输 的 概率 ， 也 就 是 : 


传输 的 概率 x 不 传输 的 概率 x..…..x 不 传输 的 概率 


例如 ， 如 果 A、B 和 C 是 仅 有 的 传输 站 点 ， 并 且 每 个 站 点 传输 的 概 
率 为 40%， 那 么 ，A 传 输 成 功 的 概率 是 0.4x0.6x0.6 = 0.14， 或 14%。 


这 是 阿 罗 哈 各 站 点 吞吐 量 的 测量 方法 ， 也 就 是 某 个 站 点 在 任何 一 
个 时 段 传输 成 功 的 概率 。 在 刚才 的 例子 中 ，A 得 到 了 信道 可 以 提供 的 
14% 的 时 段 ， 而 不 受到 干扰 。 

要 计算 系统 的 总 吞吐 量 ， 我 们 可 以 把 每 个 站 点 的 吞吐 量 相 加 。 对 
于 上 面 提 到 的 三 个 站 点 A、B 和 C， 它 们 的 总 吞吐 量 为 0.14x3=0.42， 或 
429%。 总 体 而 言 ， 在 无 干扰 的 情况 下 ， 该 系统 能 取得 不 到 一 半 的 吞吐 


=} 


量 。 
发 送 还 是 不 发 送 
刚才 我 们 看 到 的 是 影响 阿 罗 哈 吞吐 量 的 两 个 因素 : 


. 某 个 站 点 在 一 个 时 段 中 发 送 的 概率 。 
. 在 干扰 范围 内 的 站 点 数量 。 


虽然 很 难 控制 人 们 何 时 进入 和 离开 Wi-EFi 区 域 ， 但 我 们 可 以 将 执行 
传输 概率 作为 “礼貌 ”程序 的 一 部 分 。 那 么 我 们 应 该 如 何 先 择 这 个 值 
呢 ? 


让 我 们 确定 站 点 的 数量 ， 看 看 改变 传输 概率 的 影响 十 什么 。 回 到 
图 2-6: A 到 E 中 ， 哪 些 是 站 点 ? 事实 上 ， 全 部 都 是 : 设备 (A、B 和 
C) 和 接 入 点 (D 和 E) 都 需要 发 送 数 据 。 为 了 简化 问题 ， 前 面 我 们 只 
A 


图 2-9 显 示 了 ， 随 着 传 输 概率 变化 ，5 个 站 点 的 忌 否 吐 量 和 单 站 雁 
吐 量 情况 。 从 左边 开始 ， 我 们 看 到 ， 概 率 增 加 在 刚 开始 时 会 使 性 能 提 
高 : 当 概 率 很 小 时 ， 没 有 或 很 少 发 生 数据 碰撞 ， 所 以 我 们 只 是 填补 被 
痕 费 的 时 段 ， 提 高 吞吐 量 。 一 旦 发 送 概率 达到 20%， 图 中 的 曲线 达到 
约 40% 的 最 高 总 否 吐 量 。 之 后 ， 否 吐 量 就 会 下 降 ， 如 果 继 续 增 加 传输 
会 造成 更 多 的 冲突 ， 而 不 会 再 提高 否 吐 量 。 


一 一 总 在 叶 量 -=- - 单 站 生 吐 量 


传输 概率 (%) 
图 2-9 5 个 站 点 的 阿 罗 哈 协议 总 吞吐 量 和 单 站 吞吐 量 曲线 


因此 ， 对 于 5 个 站 点 来 说 ，20% 是 最 佳 传输 概率 ， 最 大 吞吐 量 为 
40%。 这 意味 着 ， 最 好 的 情况 是 每 五 个 时 段 中 有 两 个 传输 成 功 ， 这 已 
经 不 是 非常 有 效率 了 。 当 我 们 增加 更 多 站 点 时 会 发 生 什 么 ? 这 会 带 来 
更 多 的 潜在 干扰 ， 我 们 可 以 通过 进一步 减少 传输 概率 来 应 对 。 事 实证 
明 ， 可 达到 的 最 大 吞吐 量 基 本 稳定 ， 并 且 随 着 站 点 数量 增加 到 一 定 程 
度 ， 它 会 缓慢 下 降 到 37%。 如 果 你 对 详细 的 曲线 图 感 兴趣 ， 请 参考 本 
书 网 站 Q2.7 部 分 。 


总 的 来 说 ， 阿 罗 哈 并 不 能 很 好 地 扩展 到 大 量 用 户 。 这 是 Wi-Fi 的 一 
个 总 体 情况 ， 也 是 我 们 为 简单 协议 付出 的 代价 。 


在 组 合 中 加 入 感 测 


因此 ，Wi-Fi 在 使 用 阿 罗 哈 方面 有 很 多 问题 。 问 题解 决 了 吗 ? 解决 
了 一 部 分 : 目前 的 Wi-EFi 协 议 使 用 CSMA， 以 便 能 达到 更 高 的 吞吐 量 。 


阿 罗 哈 没有 试图 协调 站 点 的 传输 。 当 然 ， 它 通过 让 人 们 传输 得 更 
少 ， 减 少 了 冲突 的 次 数 ， 并 进行 随机 决定 。 但 是 ， 如 末 我 现在 有 很 多 
数据 要 发 送 ， 而 时 段 却 在 没有 人 发 送 时 开放 呢 ? 如果 我 的 随机 “硬币 投 
掷 "告诉 我 不 要 发 送 ， 那 么 我 束 不 发 送 ， 这 将 混 费 一 个 机 会 。 同 样 ， 如 
果 信 道 当前 被 占用 ， 我 应 该 能 够 知道 ， 并 暂停 发 送 。 


问题 是 ， 阿 罗 哈 是 纯粹 随机 的 ， 并 且 不 进行 感 测 。 在 停车 标志 的 

比喻 中 ， 这 融 像 用 眼 章 莹 住 你 的 眼睛 ， 让 你 随机 选择 何 时 前 进 ， 而 不 

征 否 有 车 来 。 显 然 ， 这 将 是 非常 危险 的 ， 有 可 能 导致 车 辆 碰撞 〈 虽 
然 两 帧 数据 碰撞 不 太 可 能 有 两 辆 车 相 接 的 破坏 性 强 ) 。 


传 感 载体 


利用 CSMA ， 发 送 器 在 发 送 任何 帧 之 前 ， 都 会 定期 侦 听 空间 情 
况 。 这 被 称 为 载波 侦 听 (carrier sensing) 。 你 可 以 在 图 2-10 中 看 
到 示例 : A 和 C 可 以 侦 听 到 信道 目前 被 占用 ， 束 不 会 发 送 任 何 数据 ， 直 
到 B 传 输 结 束 。 


图 2-1A0 
注 : 利用 CSMA， 站 点 进行 载波 侦 听 ， 使 其 了 解 附 近 情 况 。 站 点 周围 的 虚线 表示 其 侦 听 范围 


一 旦 站 点 看 到 一 个 空闲 的 信道 ， 它 是 不 是 就 可 以 开始 发 送 了 ? 不 
能 立即 发 送 。 确 切 地 说 ， 它 必须 首先 经 历 所 谓 的 等 待 和 侦 听 期 。 如 果 
等待 和 侦 听 期 ， 站 点 在 任何 时 刻 察觉 到 信道 忙碌 ， 那 么 它 将 保持 沉 
默 ， 就 像 图 2-11 中 的 站 点 B 一 样 。 这 类 似 于 日 常 对 话 中 发 生 的 情况 : 
当 你 认为 某 人 已 经 结束 讲话 时 ， 在 你 回答 之 前 等 待 几 秒 钟 是 常见 的 礼 
貌 行为 。 


一 旦 等 每 和 候 听 期 结束 ， 站 点 也 没有 听 到 任何 其 他 情况 ， 便 可 以 
认定 信道 空间 ， 并 开始 发 送 。 在 图 2-11 中 ， 这 首先 发 生 在 A 映 上 ， 然 
后 是 B。 显 然 ， 即 使 站 点 在 等 得 之 后 ， 它 们 的 帧 仍然 有 可 能 发 生 而 
撞 。 因 为 也 许 另 一 个 站 点 和 它 同时 开始 等 待 ， 并 同时 决定 发 送 。 


等 竺 和 


1 侦 听 
, 


等 待 和 


| | | 侦 听 
一 | | 
B 


t 时 间 
侦 听 到 忙碌 
图 2-11 
注 : 在 发 送 之 前 ， 站 点 必须 经 历 一 个 完整 的 等 待 和 侦 听 期 ， 其 间 没 有 听 到 任何 通过 它 的 传输 


站 点 如 何 知 道 它 发 送 的 帧 是 否 被 正确 接收 ? 管 案 是 通过 反馈 。 利 
用 CSMA ， 当 一 帧 数据 被 接收 ， 接 收 者 将 发 送 一 条 确认 消息 (或 ACK 
帧 ) 给 发 送 者 ， 告 诉 它 一 切 都 好 。 在 传输 ACK 帧 之 前 ， 也 有 一 个 等 待 
和 侦 听 期 。 如 果 发 送 者 没有 收 到 来 目 接收 者 的 确认 消 轧 ， 束 可 以 认为 
发 生 了 碰撞 。 你 可 以 在 图 2-12 中 看 到 示例 。 
等 竺 和 


站 点 1 侦 听 | 
. | x 


E 


图 2-12 


注 : 图 2-10 中 的 站 点 B 需 要 发 送 。 在 侦 听 到 空间 空 内 后 ， 它 经 过 等 等 和 侦 听 期 ， 并 最 终 开 始 向 
D 传 输 。 然 后 D 向 B 发 回 确认 消息 。B 收 到 确认 消息 ， 得 知 一 切 顺利 。 在 此 之 后 ，A 和 C 没 有 听 
到 任何 情况 ， 于 是 它们 经 过 等 待 和 侦 听 期 ， 并 在 同一 时 间 开 始 传输 。 它 们 没有 得 到 确认 消 
轧 ， 于 是 意识 到 倍 撞 发 生 


耐心 是 一 种 美德 


发 生 辜 撞 该 怎么 办 ? 每 个 站 点 都 需要 退 避 到 稍 后 的 时 间 ， 到 时 它 
们 将 再 次 尝试 发 送 帧 。 问 题 是 ， 站 点 如 何 选择 退 避 到 什么 时 间 ? 显 
然 ， 我 们 不 希望 它们 选择 同一 时 间 : 这 将 导致 另 一 次 碰撞 。 


相反 ，CSMA 让 每 个 站 点 选择 未 来 再 次 发 送 的 随机 时 间 。 未 来 的 
这 个 时 间 点 由 当前 竞争 窗口 (contention window) 的 大 小 决定 。 
如 果 一 个 站 点 当前 的 竞争 窗口 是 3， 那 么 它 会 选择 一 个 在 0O 和 3 之 间 的 随 
机 数 。 它 选择 的 数字 决定 它 在 再 次 发 送 前 等 待 多 少时 段 (例如 ， 如 果 
它 选 择 2， 则 会 等 待 2 个 时 上段) 。 


你 可 以 在 图 2-13 中 看 到 这 个 过 程 ， 图 中 显示 两 个 站 上 后 发生 碰 撞 的 
情况 。 前 和 完 ， 它 们 经 历 了 第 二 次 等 待 和 侦 昕 期。 然后， 它们 和 碗 择 0 和 15 
(窗口 大 小 ) 之 间 的 随机 数 ， 以 确定 何 时 再 次 发 送 。 
站 点 ”等 待 和 “0 15 

A 


| 等 竺 和 0 15 
| 俩 听 
1 
1 


随机 选择 时 段 : 3 


图 2-13 
注 : 当 A 和 B 意 识 到 已 经 发 生 磁 撞 时 ， 它 们 根据 竞争 窗口 的 大 小 〈15) 向 未 来 时 间 退 避 


随机 选择 的 目的 是 降低 站 点 再 次 碰 扩 的 概率 。 当 然 ， 站 点 也 有 可 
能 选择 相同 的 时 段 。 也 许 它 们 会 和 不 同 发 射 器 共同 发 生 磁 撞 。 如 果 帧 
不 断 碰 撞 ， 空 中 的 干扰 状况 必定 相当 严重 。 因 此 ， 所 有 遇 到 持续 帆 碰 
接 的 站 点 都 会 开始 更 积极 的 退 避 ， 它 们 通过 增加 竞争 窗口 大 小 来 达到 
这 一 目标 。 


为 了 更 好 地 理解 这 一 点 ， 我 们 可 以 回 到 鸡尾酒 会 的 比喻 。 假 设 你 
在 房间 里 和 一 群 人 聊天 ， 并 且 你 有 话 要 说 。 正 在 说 话 的 人 突然 停止 ， 
这 时 你 束 开 始 进入 你 的 内 部 “等 每 和 侦 听 ”期 。 你 可 能 给 对 方 2 秒 钟 的 时 
间 ， 如 果 他 愿意 ， 他 可 以 继续 说 话 ， 或 让 别人 做 出 回应 。 


2 秒 钟 之 后 ， 你 开始 说 话 。 但 有 人 也 开始 说 话 ， 于 古 你 们 发 生 碰 
撞 ， 双 方 都 措手不及 ， 然 后 都 停 下 来 。 你 退 避 ， 等 竺 2 秒 ， 然 后 蔷 
斌 “再 次 发 送 ”。 但 对 方 同 样 等 了 2 秒 ， 你 们 再 次 伴 撞 。 这 次 你 等 的 时 间 
更 长 ， 比 如 退 避 4 秒 。 对 方 也 一 样 ， 但 还 是 引起 了 另 一 次 碰撞 。 然 后 ， 
出 于 礼 金 ， 你 决定 等 竺 8 秒 。 最 后 ， 对 方 趁 你 没有 出 声 的 时 候 ， 开 始 说 
话 。 


这 里 有 什么 问题 ? 为 什么 “ 退 避 ”在 之 前 的 符 试 中 没有 出 现 ? 因为 
你 们 刚好 都 等 每 了 同样 的 时 间 。2 秒 ， 然 后 4 秒 。 最 后 ， 在 第 二 次 壬 试 
时 ， 你 们 都 成 功 发 送 了 消 轧 ， 因 为 你 等 每 了 8 秒 ， 而 你 的 朋友 等 得 较 
短 。 这 天 是 随机 的 重要 性 。 


这 一 间隔 (2，4，8..….) 就 是 利用 CSMA 增 加 窗口 大 小 速度 : 乘 
以 两 倍 系数 。 线 性 增加 窗口 大 小 (2，3，4...…...) 是 一 种 选择 ， 但 人 们 
认为 它 不 够 积极 ， 所 以 CSMA 要 求 以 乘法 速度 退 避 。 由 于 乘法 倍数 是 
2 3 此 它 被 称 为 二 进 制 指数 退 避 (binary exponential 
backoff) 。 


你 可 以 在 图 2-14 中 看 到 二 进 制 指数 退 避 的 示例 。 要 算出 当前 窗口 
的 大 小 ， 我 们 需要 用 之 前 的 时 段 数 乘 以 2， 再 城 去 1。 减 去 1 是 因为 我 们 


想 包括 0: 我 们 可 能 不 会 退 避 ， 而 是 立即 发 送 。 最 初 ， 我 们 有 8 个 可 能 
的 退 避 时 段 (0~7) ， 因 此 我 们 说 窗口 大 小 为 7。 接 下 来 ， 我们 有 16 个 
可 能 的 退 避 时 段 (0~15) ， 以 此 类 推 。 在 第 13 章 讨论 拥塞 控制 时 ， 乘 
法 退 避 将 再 次 出 现 。 


前 帧 


随机 选择 时 段 : 3 
等 待 和 窗口 = 15 


再 次 尝试 1 


等 待 和 


时 间 


随机 选择 时 段 : 7 
图 2-14 Wi-EFi 载 波 侦 听 多 址 访问 重复 出 现 退 避 的 示例 


注 : 磁 撞 导致 竞争 窗口 长 度 加 倍 


CSMA 还 有 许多 错综复杂 的 情况 ， 我 们 没有 时 间 去 讨论 。 例 如 ， 
你 可 能 与 你 侦 听 不 到 的 信和 号 发 生 碰 撞 ， 这 就 是 所 谓 的 隐藏 节点 问题 
(hidden node problem) 。 除 非 你 能 采取 其 他 预防 措施 ， 否 则 它 将 
成 为 一 个 问题 。 


和 阿 罗 哈 进行 比较 


当 参 数 经 过 适当 调整 后 ， 相 比 阿 罗 哈 ，CSMA 会 有 更 显著 的 性 能 
改进 。 一 方面 ， 虽 然 单 站 吞吐 量 仍然 会 随 着 站 点 增加 而 下 降 ， 但 下 降 
速度 低 于 使 用 阿 罗 哈 时 的 下 降 速度 。 另 外 ， 通 过 CSMA， 总 吞吐 量 将 
在 增加 前 几 个 站 点 时 上 升 ， 而 在 使 用 阿 罗 哈 时 这 个 数字 总 是 降低 。 


但 CSMA 并 不 能 完全 解决 碰撞 问题 。 事 实 上 ， 在 添加 几 个 站 点 
后 ，CSMA 中 的 总 吞吐 量 也 将 开始 下 降 。 虽 然 它 比 起 阿 罗 哈 有 所 改 
进 ， 但 随 着 站 点 增加 ， 其 下 降 速 度 仍 会 大 大 增加 。 


总 体 而 言 ， 无 论 是 阿 罗 哈 还 是 CSMA 都 无 法 为 大 量 Wi-Fi 设 备 扩展 
性 能 。 这 就 古人 很 多 时 ， 热 点 性 能 不 佳 的 原因 。 这 是 我 们 为 网 络 拥塞 
所 付出 的 代价 。 


到 目前 为 止 ， 本 书 的 重点 是 关于 帮助 我 们 共享 网 络 媒体 (特别 是 
空间 ) 的 不 同方 法 。 但 是 ， 关 于 应 该 如 何 计算 我 们 为 消耗 的 资源 收费 
的 方法 ， 还 没有 涉及 。 网 络 定价 也 可 以 成 为 实现 更 高 效 共 译 的 有 效 途 
径 ， 我 们 将 转 到 这 个 话题 上 。 


第 3 章 
聪明 地 为 数据 定价 


数据 费用 是 我 们 手机 账单 的 重要 部 分 。 电 信 运 营 丙 如 何 设置 这 些 
价格 点 ? 在 本 章 中 ， 我 们 将 看 到 ， 相 比 统一 费 率 或 < 目 助 餐 ? 式 的 计 
划 ， 所 谓 的 基于 使 用 的 定价 方案 如 何 为 我 们 发 送 更 好 的 反馈 信号 ， 让 
共 至 更 好 地 实现 。 害 价 可 以 成 为 管理 网 络 的 有 效 方式 。 


像 日 助 终 一 样 的 定价 


电信 合同 中 的 数据 计划 表示 我 们 为 消耗 的 数据 支付 了 多 少 费 用 。 
这 些 计划 首先 由 移动 电话 服务 商 推 出 ， 作 为 一 种 为 短信 收费 的 方式 ， 
现在 它 包括 我 们 在 手机 上 使 用 的 所 有 互联 网 应 用 ， 如 上 网 、 在 线 视频 
和 视频 聊天 。 


这 些 计划 是 如 何 构成 的 ? 想 想 我 们 的 公用 事业 账单 ， 电 力 、 水 、 
燃气 等 是 如 何 计 费 的 。 它 们 通常 是 基于 我 们 所 消耗 的 服务 量 。 例 如 ， 
如 果 电 力 公 司 为 每 度 电 收费 10 美 分 ， 那 么 使 用 500 度 电 的 人 将 文 付 50 美 
元 ， 而 如 果 人 们 把 消耗 的 电量 减 半 ， 那 么 束 只 有 25 美 元 。 这 种 “用 的 
多 ， 伦 的 多 ”的 定价 方案 听 起 来 通俗 易 懂 。 数 据 计 划 也 是 这 样 计 费 的 
吗 ? 


越 来 越 多 的 答案 是 肯定 的 ， 但 仅 在 过 去 几 年 是 这 样 。 尽 管 提供 无 
线 蜂 罕 容 量 昂贵 且 难 以 增加 ， 但 在 一 些 国家 (例如 美国 ) ， 消 费 者 过 
去 每 月 只 需 支付 固定 的 数据 费用 ， 不 管 他 们 消耗 了 多 少 移动 数据 。 这 
种 方案 被 称 为 统一 费 率 (flat-rate) 定价 。 


目 助 餐 好 吗 ? 


统一 费 率 是 什么 意思 ? 它 不 取决 于 你 实际 消费 了 多 少 。 想 象 一 家 
提供 自助 餐 的 餐厅 (如 图 3-1 所 示 ) : 支付 一 定 费 用 进门 后 ， 你 可 以 想 
吃 多 少 束 吃 多 少 。 效 仿 他 人 对 你 最 有 利 ， 因 为 无 论 你 吃 一 盘 、 两 盘 还 
年 五 盘 食物 ， 都 不 会 多 付 一 分 钱 ， 所 以 ， 趁 你 有 机 会 ， 能 吃 什么 融 吃 
人 
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图 3-1 


注 : 自助 餐厅 基于 统一 费 率 定价 


目 助 餐 对 你 来 说 很 划算 ， 尤 其 是 当 你 场 的 时 候 。 但 是 ， 如 果 你 不 
想 吃 太 多 ， 可 能 束 不 那么 合适 了 ， 因 为 只 为 少量 食物 ， 你 殉 要 文 付 目 
助 餐 的 价格 。 再 从 餐厅 的 角度 来 思考 : 如 条 人 们 每 次 光顾 时 ， 都 会 吃 
掉 更 多 的 食物 呢 ? 如 果 顾 客 的 饭量 每 年 都 翻 倍 ， 那 餐厅 还 能 以 相同 的 
价格 提供 目 助 餐 吗 ? 


多 年 来 ， 移 动 行 业 的 数据 计划 基于 统一 费 率 定 价 ， 而 语音 计划 则 
不 是 。 原 因 是 ， 过 去 儿 十 年 中 ， 无 线 运 营 商 把 语音 通话 和 信息 视 为 手 
机 的 主要 用 途 ， 而 不 是 移动 数据 。 通 过 文 付 某 个 费 率 ， 比 如 每 月 30 天 
元 ， 网 络 将 成 为 你 的 “ 目 助 餐 ”， 让 你 随心 所 欲 地 使 用 数据 。 很 长 一 段 


时 间 以 来 ， 这 样 的 计划 对 于 供应 两 是 有 意义 的 ， 因 为 蜂 久 设备 所 消耗 
的 数据 量 很 低 。 手 机 的 主要 目的 是 语音 通话 ， 数 据 被 视 为 次 要 的 附加 
功能 。 


随 着 智能 手机 的 普及 ， 这 种 情况 迅速 改变 。 由 于 手持 设备 能 够 浏 
览 网 页 、 在 线 播放 音乐 视频 ， 并 文 持 其 他 各 种 数据 密集 型 应 用 程序 ， 
因此 ， 人 们 对 数据 的 需求 开始 迅速 上 升 。 例 如 ，2007 年 推出 的 第 一 代 
苹果 手机 使 蜂 久 数据 需求 诡 升 50 倍 。 许 多 应 用 程序 也 能 够 在 后 台 运 行 

(不 需要 人 在 男 一 方 操作 ) ， 并 且 很 快 机 器 之 间 和 设备 之 间 的 直接 通 
信也 将 创造 更 多 的 数据 需求 。 除 了 新 的 应 用 之 外 ， 使 用 智能 手机 的 人 
数 也 在 刺激 数据 需求 增加 。 


“乔布斯 的 容量 不 平等 ” 


图 3-2 显 示 了 ， 截 至 2015 年 移动 数据 流量 传输 的 规模 ， 并 预计 出 到 
2019 年 将 增加 的 数量 。 字 节 (byte) 是 衡量 数据 大 小 的 单位 ， 但 一 
个 字 节 是 相当 小 的 数量 ; 一 个 音频 文件 通常 包含 数 百 万 字 节 ， 而 一 个 
视频 可 能 有 数 十 亿 字 节 。 所 以 ， 我 们 通常 将 数据 大 小 表示 为 兆 字 节 
(MB， 包 含 百 万 字 节 ) ， 或 千 兆 字 节 (GB， 包 含 十 亿 字 节 ) 。 在 图 
3-2 中 ， 数 字 单位 为 艾 字 节 ， 一 个 艾 字 节 相 当 于 十 亿 千 兆 字 节 。 这 意味 
着 ， 在 2015 年 每 月 有 42 亿 GB 的 移动 数据 通过 互联 网 传输 ! 该 数字 还 在 
增加 ， 预 计 未 来 将 以 每 年 约 50% 的 速度 增加 。 


每 月 移动 数据 艾 字 节 数 


2012 2013 2014 2015 2016 2017 2018 2019 (年 份 ) 


图 3-2 每 年 单 月 移动 数据 流量 图 
注 : 由 思科 公司 预测 至 2019 年 


哪些 应 用 占据 了 大 部 分 的 数据 消费 ? 图 3-3 将 2014 年 的 数据 按 应 用 
类 型 划分 。 其 中 ， 在 线 视频 约 占 55%， 消 费 了 最 多 的 数据 ， 其 次 是 网 
页 浏览 ， 约 占 36%。 两 者 之 和 占 所 有 数据 需求 的 比例 超过 90%。 除 了 
有 限 的 网 页 浏览 ， 在 智能 手机 和 平板 电脑 出 现 前 ， 这 些 功能 都 是 无 法 
在 移动 设备 上 使 用 的 。 


文件 共享 


图 3-3 


正如 目 助 餐 只 提供 有 限 的 食物 给 顾客 ， 网 络 也 只 有 有 限 的 能 力 来 
支持 数据 流 进出 我 们 的 设备 。 在 史 带 夫 : 乔 布 斯 于 2007 年 推出 第 一 款 苹 
果 手 机 后 不 入， 束 有 人 预测 ， 数 据 需求 的 增长 正在 超过 供应 量 的 增长 
速度 。 因 为 供应 量 只 会 随 着 提高 网 络 容量 方面 的 投资 的 增加 而 增加 。 
多 年 来 ， 两 者 的 差距 一 直 在 扩大 。 


你 可 以 在 图 3-4 中 看 到 这 种 趋势 的 略图 。 我 们 称 其 为 “乔布斯 的 容 
量 不 平等 "。 一 旦 工程 师 和 开发 人 员 想 出 让 使 用 移动 互联 网 数据 更 方 
便 、 更 有 吸引 力 的 方法 ， 用 户 需 求 (以 及 数据 应 用 创新 ) 便 会 开始 迅 
速 增长 ， 并 超过 供应 增长 的 步伐 。 
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图 3-4 随 着 时 间 的 推移 ， 移 动 数据 容量 的 需求 和 供给 趋势 


没有 技术 可 以 每 年 无 止境 地 大 幅 提高 成 本 效益 。 需 要 有 一 种 调 季 
需求 的 方法 ， 使 其 与 容量 保持 一 致 ， 使 网 络 能 够 更 有 效 地 共享 。 


用 的 多 ， 花 的 多 


互联 网 服务 提供 商 (ISP) 想 出 的 办 法 是 什么 ? 它们 不 再 收取 统一 
费 率 ， 而 是 开始 转向 基于 使 用 (usage-based) 的 定价 方案 ， 根 据 
每 月 消费 的 数据 量 向 用 户 收取 费用 。 这 种 收费 方式 向 消费 者 发 出 不 同 
的 定价 信号 ， 他 们 不 是 无 论 每 个 月 使 用 多 少 都 按 统一 费 率 缴费 ， 而 要 
为 自己 消费 的 每 一 批 数 据 支付 费用 。 你 可 以 在 图 3-5 中 看 到 ， 统 一 费 率 
完全 独立 于 实际 消费 ， 而 基于 使 用 的 收费 标准 为 超过 某 个 定额 的 每 批 
数据 收取 额外 费用 。 基 于 使 用 定价 的 “阶梯 ”"， 其 具体 形状 取决 于 给 定 
时 间 内 运营 商 的 定价 细节 。 
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图 3-5 


肖 费 者 发 出 不 同 的 信号 。 在 基于 使 用 定价 的 方案 中 ， we 
就 会 增加 每 月 费用 ， 这 种 增长 趋势 呈 “ 阶 梯 ” 形 状 。 


统一 费 率 和 基于 使 用 的 定价 向 ; 
超过 定 大 的 数 所 (例如 每 个 额外 的 GB) 
一 费 率 则 完全 独立 于 每 月 的 实际 消费 


个 由 网 络 发 出 的 信号 成 为 一 种 给 客户 的 负 有 反馈 形 式 。 在 第 1 章 
我 们 看 到 了 功率 控制 的 负 皮包 基于 信道 条 件 ， 网 络 反 馈 测 量 信 
号 干扰 比 ， 以 调节 每 台 设 备 的 信号 功率 。 第 2 章 中 ，Wi-Fi 随 机 访问 的 
确认 也 是 一 种 负 反馈 ， 我 们 将 在 第 13 章 互联 网 拥塞 控制 部 分 更 具体 地 
探讨 这 一 问题 。 在 本 章 中 ， 网 络 通过 反馈 基于 使 用 的 价格 ， 根 据 现 有 
容量 调整 每 个 用 户 的 需求 。 从 而 要 求 每 个 消费 者 将 其 对 网 络 的 负 外 部 
性 〈 即 其 引起 的 拥塞 ) 加 以 内 化 ， 为 自己 消费 的 数据 量 支 付费 用 。 友 
馈 再 次 成 为 网 络 资源 共 译 的 一 个 共同 主题 。 


基于 使 用 的 转移 


推出 基于 使 用 的 定价 标准 有 两 个 典型 的 先决 条 件 。 首 先生 整个 市 
场 的 网 络 使 用 量 激增 ， 且 其 需求 增长 速度 将 超过 供应 量 的 增 速 。 对 于 
蜂 久 网 络 而 言 ， 这 种 趋势 发 生 在 苹果 手机 、 安 日 关 能 手机 和 平板 电脑 
推出 之 后 。 更 多 的 用 户 和 性 能 更 强 的 设备 促使 需求 不 断 增长 ， 导 人 致 用 
尸 消耗 更 多 的 数据 。 这 使 得 互联 网 服务 提供 商 的 成 本 更 高 ， 因 为 它们 


必须 提供 额外 的 容量 。 基 于 使 用 的 定价 有 助 于 使 互联 网 服务 提供 商 的 
收入 赶 上 为 支持 需求 上 升 市 来 的 成 本 。 


第 二 个 条 件 是 政府 法 规 允 许 定 价 模 式 创新 。 虽 然 这 种 模式 涉及 许 
多 监管 问题 ， 但 使 每 月 费用 与 使 用 量 成 正比 是 争议 最 少 的 方案 。 


到 2010 年 ， 美 国 已 经 开始 转向 基于 使 用 的 定价 方案 。 同 年 4 月 ， 
AT&T (美国 电话 电报 公司 ) 公布 了 为 3G 数 据 用 户 提 供 的 基于 使 用 的 
定价 方案 。 次 年 3 月 ， 威 瑞 森 紧 随 其 后 ， 先 为 苹果 手机 和 苹果 平板 电脑 
用 户 提 供 此 类 方案 ， 然 后 在 2011 年 为 所 有 3G 数 据 用 户 推 出 新 方案 。 
2012 年 3 月 ，AT&T 对 之 前 使 用 无 限 数据 计划 的 消费 者 宣布 ， 一 旦 使 用 
量 超过 定额 ， 其 连接 速度 将 季 流 ( 即 下 降 ) 。 此 后 不 久 ，AT&T 和 威 
瑞 森 无 线 为 “新 苹果 平板 电脑 ”推出 4G 数 据 计 划 ， 并 宣布 不 再 提供 任何 
类 型 的 无 限 数据 选择 。 


2012 年 6 月 ， 威 瑞 森 公司 再 次 更 新 其 手机 定价 计划 。 客 户 能 以 统一 
费 率 获得 语音 和 短信 服务 ， 作 为 将 其 无 限 数据 计划 转换 为 基于 使 用 的 
计划 的 补偿 。AT&T 在 1 个 月 后 采取 了 类 似 的 措施 。 世 界 上 许多 其 他 国 
家 也 已 经 采取 或 正在 考虑 类 似 的 措施 ， 为 3G、4G 甚 至 有 线 网 络 推出 新 
方案 。 运 荡 商 认为 ， 相 比 于 语音 ， 基 于 使 用 的 定价 方案 对 数据 更 重 
要 ， 因 为 手机 的 “主要 ”用 途 现 在 已 经 从 语音 通话 转换 到 数据 应 用 上 。 


长 尾 越 来 越 长 


除了 纯粹 的 容量 限制 ， 还 有 其 他 原因 促使 互 联网 服务 提供 商 转换 
到 基于 使 用 的 定价 模式 上 。 其 中 一 个 重要 的 原因 是 ， 最 重度 的 数据 用 
户 也 是 需求 增加 最 多 的 用 户 。 如 采 根 据 用 户 的 使 用 情况 把 他 们 分 成 三 
类 : 轻 度 、 中 度 和 重度 ， 丈 会 出 现 图 3-6 显 示 的 情况 。 当 我 们 顺 着 图 的 
横 坐 标 同 右 看 时 ， 会 发 现 需 要 如 此 多 容量 的 用 户 在 逐渐 减少 。 但 在 决 
定 互 联网 服务 提供 商 管理 网 络 的 成 本 时 ， 最 右边 、 最 重度 的 用 户 往 往 
征 主 导 因 隶 。 这 个 尾巴 一 直 很 长 ， 意 味 着 有 少数 用 户 消耗 了 大 量 数 


据 ， 但 现在 尾巴 更 长 了 。 随 着 尾巴 变 长 ， 成 本 和 收益 之 则 的 差距 会 不 
断 增 加 ， 除 非 改 变 定价 方法 。 


用 户 比 例 


图 3-6 


注 : 有 些 人 是 轻 度 数据 使 用 者 ， 有 些 人 是 中 度数 据 使 用 者 ， 还 有 少数 是 重度 数据 使 用 者 。 尾 
部 的 重度 使 用 者 是 决定 互联 网 服务 提供 商 成 本 结构 的 消费 者 


基于 使 用 的 定价 计划 


互联 网 服务 提供 商 提供 的 基于 使 用 的 数据 计划 是 什么 样 的 ? 在 图 
3-7 中 ， 你 可 以 看 到 威 瑞 森 在 2016 年 年 初 推 出 的 五 个 计划 。 一 般 来 说 ， 
这 些 计 划 主 要 有 三 大 特 友 : 
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四 Fi 
每 月 消费 的 数据 量 (GB) 
图 3-7 威 瑞 森 在 2016 年 1 月 的 五 项 数据 计划 选择 
注 : 每 条 线 代 表 客 户 可 以 选择 的 一 项 计划 

。 在 一 个 基准 下 ， 收 费 仍然 采取 统一 费 率 。 例 如 ， 中 间 的 威 珊 

和 森 计 划 将 对 每 月 使 用 不 超过 6 GB 的 用 户 收取 60 美 元 。 
， 对 于 超出 基准 的 部 分 ， 基 于 使 用 的 收费 标准 开始 生效 。 这 些 
威 瑞 森 计划 为 每 增加 的 1GB 收 费 15 美 元 。 使 用 超过 6 GB 时 ， 中 间 计 
划 开 始 收取 15 美 元 / GB 的 费用 。 所 以 你 将 为 7 GB 文 付 75 美 元 ， 为 8 
GB 支付 90 美 元 ， 以 此 类 推 。“ 阶 梯 * 形 状 表示 定价 以 1 GB 为 单位 递 


增 。 


“ 总 费用 基于 每 月 的 总 使 用 量 。 使 用 的 时 间 、 地 点 、 用 途 都 不 
重要 ， 唯 一 重要 的 是 你 用 了 多 少 。 


根据 使 用 量 来 收费 听 上 去 很 直观 。 毕 竞 ， 大 多 数 公 用 事业 品 和 商 
员 都 是 这 样 计 费 的 。 但 那些 习惯 于 以 统一 费 率 上 网 的 人 刚 开 始 可 能 会 
觉得 这 很 讨 慌 。 如 采 内 容 消 费 最 终 会 受到 影响 ， 那 么 基于 使 用 的 定价 

案 


方案 将 影响 “食物 链 ” 中 的 每 个 人 : 消费 者 、 网 络 供应 商 、 内 容 提供 
商 、 应 用 程序 开发 人 员 、 设备 制造 商 和 广告 商 。 然 而 ， 我 们 会 看 到 有 


ET 


几 个 强 有 力 的 原因 ， 其 中 包括 有 利于 消费 着 的 原因 ， 即 文 持 基于 使 用 
的 定价 成 为 对 统一 费 率 的 目 助 餐 式 定价 更 好 的 替代 方式 。 


不 管 怎 样 ， 网 络 的 建设 和 运 彰 成 本 必须 有 人 文 付 。 然 而 ， 基 于 每 
月 消费 的 定价 标准 并 不 是 互联 网 服务 提供 商 可 以 解决 这 个 问题 的 唯一 
pa 


为 什么 不 提高 所 有 人 的 统一 费 率 呢 ? 有 了 足够 高 的 统一 费 率 后 ， 
提供 商 获得 的 收入 将 足以 维持 网 络 运行 。 然 而 ， 对 于 许多 不 消耗 大 量 
数据 、 可 能 无 法 负担 增加 费用 的 用 户 来 说 ， 这 将 是 不 公平 的 。 或 者 限 
制 重度 用 户 的 流量 呢 ? 一 旦 消费 者 用 量 超过 阔 值 ， 他 可 能 会 被 禁止 使 
用 网 络 。 如 果 你 对 其 他 可 能 性 感 兴趣 ， 请 参考 本 书 网 站 Q3.1 和 Q3.2 部 


分 。 


或 者 ， 我 们 可 以 考虑 “更 聪明 ”的 定价 版 本 吗 ?” 2010 年 中 期 以 来 ， 
智能 数据 定价 〈 简 称 SDP) 已 在 世界 各 地 迅速 发 展 起 来 。 智 能 数据 
定价 有 各 种 不 同 的 方法 ， 我 们 可 以 从 三 个 方面 来 考虑 。 


如 何 收费 


首先 ， 互 联网 服务 提供 商 应 该 怎样 收费 ? 正如 我 们 所 说 的 ， 基 于 
使 用 的 定价 是 现在 的 标准 模式 。 在 一 些 国 家 ， 互 联网 服务 提供 商 甚 至 
会 因为 移动 数据 配额 中 的 未 使 用 部 分 而 奖励 客户 ， 或 允许 他 们 交易 那 
些 部 分 。 下 一 步 是 基于 拥塞 的 定价 ， 在 特殊 情况 下 基于 时 间 〈 即 在 一 
天 中 需求 较 低 的 时 间 收 费 较 少 ) 或 基于 位 置 ( 即 在 需求 较 低 的 地 点 收 
费 较 少 ) 来 定价 。 你 可 以 认为 ， 比 起 我 们 到 目前 所 讨论 的 基于 使 用 的 
定价 方案 ， 这 是 癌 最 终 用 户 发 送 了 一 个 更 为 具体 的 反馈 信号 : 价格 变 


化 不 仅 基 于 每 月 的 消费 量 ， 也 取决 于 当前 的 拥塞 状况 ， 进 而 在 更 精细 
的 尺度 下 调 市 网 络 需 求 和 利用 。 


例如 ， 亚 马 还 在 其 云 服 务 中 的 现货 定价 方式 ， 该 服务 的 价格 基于 
当前 的 需求 (和 供应 ) 波动 。 男 一 个 例子 古 伦 吝 的 交通 系统 ， 在 工作 
日 ， 中 央 商 务 区 的 公共 交通 会 收取 较 高 费用 。 


向 谁 收 费 


其 次 ， 互 联网 服务 提供 商 应 该 向 谁 收费 ? 除了 对 移动 数据 的 直接 
消费 者 收费 ， 网 络 运营 商 可 能 想 向 食物 链 上 的 其 他 人 收取 费用 。 内 容 
提供 商 的 网 站 获得 点 击 率 ， 是 否 应 该 向 它们 收费 呢 ? 根据 推广 内 容 

(sponsored content) 计划 ， 这 些 供应 商 可 能 与 最 终 用 户 分 摊 成 
本 。Kindle 电 子 书 就 遵循 这 个 模式 。 它 有 时 也 被 运用 于 机 场 Wi-Fi 上 ， 
你 可 以 在 观看 某 个 广告 后 ， 免 费 或 以 相对 便宜 的 价格 上 了 网。 此 外 ， 对 
于 允许 员工 携带 个 人 设备 工作 的 公司 呢 ? 通过 分 割 计 费 (split 
billing) ， 员 工 的 一 部 分 移动 数据 费用 可 以 由 雇主 支付 ， 以 补偿 他 们 
在 工作 中 增加 的 使 用 量 。 


更 为 普遍 的 是 ， 使 用 零 费 率 (zero-rating) 或 无 收费 (toll- 
free) 数据 ， 人 们 为 特定 应 用 消耗 的 数据 支付 较 少 (或 不 支付 ) 费 
用 。 无 收费 有 两 种 形式 : 封闭 式 和 开放 式 。 想 想 脸 书 在 2015 年 提出 的 
internet.org 倡 议 一 一 让 发 展 中 国家 廉价 上 网 : 这 是 一 个 封闭 式 无 收费 
的 模式 ， 像 围墙 花园 一 般 ， 通 常 被 认为 是 与 网 络 中 立 原则 不 相 容 的 。 
相反 ， 移 动 数据 的 1-800 号 码 则 是 开放 式 无 收费 的 例子 : 任何 人 都 可 以 
赞助 全 部 或 部 分 移动 数据 费用 ， 而 不 只 是 那些 经 过 特定 门户 的 人 。 


对 什么 收费 


第 三 ， 互 联网 服务 提供 商 应 该 对 什么 收费 ? 当然， 基本 的 方法 古 
对 数据 使 用 收费 。 但 是 ， 为 什么 不 同时 基于 ， 比 如 最 终 用 户 体验 或 网 


上 交易 来 收费 呢 ? 一 些 云 提供 商 已 经 根据 客户 所 需 的 服务 质量 (QoS 
级 别 ) 收取 费用 ， 例 如 完成 计算 任务 所 需 的 时 间 。 


通过 询问 如 何 收费 、 辐 谁 收 费 以 及 对 什么 收费 ， 智 能 数据 定价 可 
以 发 出 更 有 效 的 定价 信号 ， 实 现 更 高 效 的 共事 。 以 无 限 方式 使 用 无 限 
移动 数据 的 日 子 已 经 一 去 不 复 返 了 : 现在 我 们 的 创新 围绕 “有 限 的 数 
据 ? 或 “有 限 的 方式 ”。 


相对 于 统一 费 率 ， 基 于 使 用 定价 所 具有 的 一 些 优点 我 们 已 经 探讨 
过 。 其 中 的 一 个 优点 古 ， 它 辣 客 户 发 送 了 更 有 效 的 定价 信号 。 在 本 市 
的 结尾 ， 你 会 明日 其 中 的 原因 。 

我 们 首先 要 介绍 一 些 经 济 学 的 基本 概念 。 

更 高 的 数量 ， 更 高 的 效用 


假设 你 附近 有 免费 的 比 陵 〈 见 图 3-8) 。 你 刚好 饿 了 ， 而 比 陕 是 你 
言 欢 的 类 型 ， 你 想 拿 几 片 。 


Ce 
Sad 


图 3-8 


注 ， 如 果 你 饿 了 ， 多 吃 几 片 比萨 会 给 你 带 来 更 多 的 “快乐 "或 饱 腹 感 。 但 到 达 一 定 程度 后 ， 每 
增加 一 片 比萨 ， 你 的 快乐 程度 就 会 降低 一 点 儿 

你 拿 起 第 一 片 。 味 道 好 极 了 ， 同 时 它 肯 定 也 使 你 的 食欲 降低 了 一 
点 儿 。 你 还 想 吃 ， 所 以 你 拿 起 第 二 片 。 同 样 ， 它 的 味道 很 好 ， 令 人 浦 
意 ， 但 比 不 上 第 一 斤 带 给 你 的 满足 感 。 在 此 之 后 ， 你 仍然 有 点 儿 饿 ， 
所 以 你 接着 吃 了 第 三 片 。 它 的 味道 仍然 不 错 ， 但 你 不 那么 饿 了 ， 所 以 
它 没 有 带 给 你 吃 第 一 厂 或 第 二 片 那 样 多 的 “好 处”。 


这 个 过 程 继续 下 去 (取决 于 你 可 以 吃 多少 比 茸 ) ， 直 到 最 终 你 无 
所 谓 再 多 吃 一 片 。 因 为 它 是 免费 的 ， 你 可 能 会 因为 它 的 味道 不 错 而 继 
续 吃 ， 但 此 时 你 不 会 愿意 为 区 一 片 付 钱 。 


这 是 一 个 人 的 效用 (utility)”( 即 “快乐 ") 随 着 分 配给 他 们 的 资 
源 量 而 改变 的 例子 。 无 论 资源 是 食物 、 消 费 电 子 产品 、 蜂 窝 数 据 或 其 
他 什么 ， 重 要 的 是 根据 用 户 得 到 的 资源 量 ， 判 断 出 他 们 的 效用 是 什 
么 。 如 图 3-9 所 示 ， 效 用 的 表现 普遍 具有 两 种 特性 : 


效用 


图 3-9 典型 效用 曲线 图 形 
注 : 更 多 的 数量 总 是 导致 效用 增加 ， 但 福利 的 变化 在 数量 较 多 时 减少 


。 增 加 :， 随 着 分 配 数量 的 增加 ， 效 用 不 断 增 加 。 更 多 的 数据 带 
来 更 多 的 好 处 。 


。 边 际 收益 递减 :在 某 一 点 之 上 ， 效 用 开始 放 慢 增长 。 ° 你 可 
能 把 前 几 个 GB 数据 用 得 最 好 ， 然 后 附加 增益 开始 下 降 。 这 就 是 边 
际 收益 递减 《diminishing marginal returns) 原则 。 


更 高 的 价格 ， 更 低 的 需求 


我 们 如 何 量化 某 人 的 效用 呢 ? 一 个 第 用 的 方法 是 观察 消费 者 对 于 
该 资源 的 表现 如 何 。 我 们 将 探讨 这 一 但 是 如 果 你 对 其 他 可 能 的 
做 法 感 兴趣 ， 请 参考 本 书 网 站 Q3.3 部 分 


每 当 有 人 进行 消费 时 ， 此 人 一 定 希 望 他 的 净 效 用 (net utility) 
尽 可 能 高 。 这 是 他 从 购买 中 获得 的 收益 ， 也 就 是 他 的 满意 度 和 他 所 支 


付 的 金钱 之 间 的 差异 。 当 客户 以 某 一 特定 单位 价格 ( 即 10 美 元 / GB) 
购买 某 种 商品 时 ， 其 收益 为 : 


收益 = 效用 -单价 x 数量 


根据 所 请 的 需求 (demand) ， 用 户 购 买 的 数量 又 取决 于 价格 的 
高 低 。 你 可 能 会 猜测 ， 较 高 的 价格 会 导致 较 低 的 需求 ， 例 如 ， 如 果 数 
据 的 价格 翻 倍 ， 你 将 消耗 更 少 的 数据 ， 而 如 果 价 格 减 半 ， 你 会 消耗 更 
多 。 两 者 的 精确 关系 通过 需求 曲线 显示 ， 这 可 以 在 现实 中 形成 复杂 的 
形状 。 出 于 我 们 的 目的 ， 我 们 将 考虑 线性 需求 ， 如 图 3-10 所 示 。 


需求 
FT - 


价格 


单价 


图 3-10 线性 需求 曲线 
注 ， 它 显示 如 果 卖 方 以 特定 的 单价 出 售 资源 时 ， 每 人 预计 购买 的 数量 
假设 卖方 已 经 确定 了 基于 使 用 的 价格 ， 那 么 要 找到 用 户 的 效用 和 
净 效 用 会 比较 容易 。 在 图 3-11 的 图 形 中 : 


请 价 价格 


图 3-11 
注 : 根据 基于 使 用 的 定价 方案 ， 效 用 是 A+B， 支 付 的 金额 是 B， 净 效用 是 A 


* 根据 售 价 ， 我 们 可 以 在 曲线 上 得 到 用 户 的 需求 信息 。 


* 回 用 户 收 取 的 总 价 等 于 单价 乘 以 数量 。 表 现 为 几何 形式 ， 这 
苹 图 中 矩形 B 的 面积 。 


“用户 的 效用 是 需求 曲线 左 侧 低 于 购买 数量 的 总 面积 。 换 句 话 
说 ， 它 是 三 角形 A 和 算 形 B 的 总 面积 : A+B。 


。 最 后 ， 我 们 可 以 通过 从 效用 中 减 去 价格 得 到 净 效 用 : 
(A+B) -B =A， 即 三 角形 A 的 面积 。 
基于 使 用 定价 下 的 消费 


关于 需求 曲线 ， 有 一 个 更 基本 的 问题 需要 回答 : 为 什么 一 开始 ， 
用 户 消耗 的 数量 束 要 被 固定 在 这 条 曲线 上 昵 ? 换 名 话说， 为 什么 无 法 


激励 人 进行 更 多 消费 ， 或 减少 购买 呢 ? 其 原因 是 ， 在 基于 使 用 的 定价 
下 ， 单 价 对 应 的 数量 将 使 用 户 的 净 效 用 最 高 。 


要 理解 这 一 点 ， 让 我 们 想 一 想 ， 当 有 人 在 需求 曲线 上 降低 或 提高 
消费 量 时 ， 会 发 生 什么 。 这 两 种 情况 如 图 3-12 所 示 。 在 左 侧 ， 用 户 在 
需求 曲线 上 降低 数量 : 这 会 导致 收费 (B1 部 分 的 面积 ) 减少 ， 但 同时 
也 导致 效用 (A1+B1 的 总 面积 ) 减少 。 所 以 ， 净 效用 将 比 开始 时 下 降 
Al 部 分 的 数量 。 减 少 的 效用 大 于 减少 的 文 出 。 在 右 侧 ， 用 户 在 原来 的 
数量 上 增加 消费 : 效用 上 升 了 A2， 而 收费 上 涨 A2 + B2， 导 致 净 效 用 
下 降 B2 部 分 的 面积 。 增加 的 成 本 大 于 增加 的 效用 。 


减少 数量 增加 数量 


降低 Al 部 分 效用 降低 B2 部 分 效用 


图 3-12 
注 : 解释 为 什么 在 以 使 用 为 基础 的 定价 下 ， 坚 持 需 求 曲线 符合 用 户 的 最 佳 利益 


这 束 是 为 什么 在 基于 使 用 的 计划 中 ， 根 据 需 求 曲 线 进行 消费 忌 古 
符合 消费 者 的 最 佳 利益 。 根 据 数 据 单价 计 费 ， 可 以 使 互联 网 服务 提供 
商 能 够 规范 用 户 在 移动 网 络 中 消费 数据 的 需求 。 如 果 互 联网 服务 提供 
商 基 于 操作 和 维护 网 络 的 成 本 来 设置 单价 ， 这 将 给 消费 者 发 送 有 效 的 
反馈 信号 ， 迫 使 他 们 将 其 在 消费 时 对 网 络 施加 的 负 外 部 性 内 化 。 


统一 费 率 下 的 消费 


统一 费 率 定价 也 会 驱使 用 户 保持 在 需求 曲线 上 吗 ? 请 记 住 ， 不 论 
消耗 数量 多 少 ， 统 一 费 率 定价 计划 只 收取 单一 、 固 定 的 价格 。 在 这 个 
计划 下 ， 尽 可 能 多 地 获得 数据 才 符 合 客户 的 最 大 利益 ， 直 到 无 法 获得 
更 多 的 效用 。 所 以 ， 用 户 会 偏离 曲线 


想 想 看 : 如果 你 每 月 只 为 数据 计划 支付 20 美 元 ， 那 什么 会 阻止 你 
在 线 播放 100 个 视频 ， 而 不 是 10 个 呢 ? 肯定 不 是 钱 。 你 会 消耗 你 每 个 月 
需要 的 尽 可 能 多 的 数据 ， 直 到 你 不 再 需要 为 止 。 


公 地 悲剧 


要 理解 为 什么 统一 费 率 定价 对 于 网 络 来 说 并 不 合适 ， 让 我 们 来 看 
看 一 个 经 济 学 上 被 广泛 引用 的 比喻 一 “ 公 地 悲剧 ” (tragedy of the 
commons) ， 它 由 加 勒 特 : 哈 丁 在 1968 年 提出 (关于 基于 使 用 定价 方 
案 的 更 多 优点 ， 请 参考 本 书 网 站 Q3.4 部 分 ) 。 这 个 比喻 假设 一 群 牧民 
共享 牧场 ， 他 们 都 用 其 来 饲养 自己 的 牲畜 ( 见 图 3-13) 。 每 个 牧民 都 
有 能 力 增加 更 多 的 牛 ， 在 土地 上 放牧 。 


图 3-13 
注 : 在 “ 公 地 悲剧 ”的 比喻 中 ， 一 群 牧民 在 一 块 共 有 土地 上 饲养 牲畜 


现在 ,假设 牧民 鲍 劲 正 要 决定 是 否 在 牛 群 中 增加 一 头 牛 。 为 了 最 
大 限度 地 提高 个 人 收益 ， 他 想 : “如 采 我 再 增加 一 头 牛 ， 这 将 如 何 影响 
我 的 净 效 用 呢 ? “一 方面 ， 如 果 他 增加 一 头 牛 ， 他 将 获得 出 售 这 头 牛 的 
所 有 收入 。 男 一 方面 ， 增 加 一 头 牛 将 使 土地 距离 过 度 放 牧 更 近 一 步 。 
一 旦 牲畜 太 多 ， 牧 场 将 被 耗 尽 ， 所 有 牲畜 都 会 死 。 但 是 这 项 成 本 是 由 
所 有 牧民 平均 承担 的 ， 所 以 对 于 鲍 动 本 人 来 说 ， 比 起 他 将 从 增加 牲畜 
中 获得 的 收益 ， 这 只 会 使 净 效 用 略微 减少 。 


因此 鲍 劲 认定 ， 在 牛 群 中 增加 一 头 牛 符合 他 的 最 大 利益 。 所 以 每 
次 他 经 历 这 个 思考 过 程 后 ， 都 决定 再 加 一 头 牛 。 其 他 牧民 都 面临 同样 
的 决定 ， 也 采取 同样 的 行动 。 


最 终结 采 是 什么 ? 牧场 大 小 有 限 ， 所 以 随 着 牲畜 越 来 越 多 ， 牧 场 
将 过 度 拥 挤 和 过 度 放 牧 (图 3-14) 。 最 终 ， 将 没有 土地 可 以 放牧 。 到 
那 时 ， 所 有 牲畜 都 将 挨 饿 ， 这 对 所 有 人 来 说 都 古 最 糟 料 的 情况 。 由 于 
没有 正确 的 价格 信号 ， 鲍 劲 和 其 他 牧民 集体 耗 尽 牧场 ， 本 成 “ 塌 剧 ”。 


图 3-14 
注 : 出 于 目 身 利益 ， 每 个 牧民 都 会 不 断 地 增加 牛 的 数量 。 公 地 悲剧 的 结果 是 ， 由 于 过 度 放 


牧 ， 草 地 变 得 拥挤 不 堪 ， 最 终 被 耗 尽 


我 们 如 何 看 繁 这 种 现象 人 在 统一 费 率 数据 计划 下 消耗 更 多 数据 
的 原因 ， 类 似 于 每 个 牧民 都 想 不 断 增加 牲畜 的 原因 。 消 费 者 每 次 从 网 
络 上 获取 数据 ， 都 不 会 产生 额外 费用 。 从 个 人 的 角度 看 ， 唯 一 的 "成 
本 ”十 他 们 增加 的 微不足道 的 拥挤 ， 所 以 获取 尽 可 能 多 的 数据 符合 他 们 


的 最 佳 利益 。 但 这 最 终 可 能 导致 “悲剧 ”>， 由 于 所 有 人 的 巨大 需求 ， 网 
络 将 被 压 垮 。 这 是 一 个 网 络 负 效 应 (negative network effect) 的 
例子 。 


问题 在 于 ， 我 们 没有 有 效 的 定价 信号 。 额外 的 数据 将 市 来 更 多 效 
用 ， 这 很 容易 超过 一 个 人 为 在 网 络 中 增加 数据 额外 支付 的 “成 本 。 我 
们 需要 考虑 到 ， 每 次 数据 查询 都 会 在 网 络 上 产生 仙 外 部 性 ， 束 像 我 们 
在 第 1 章 看 到 的 : 手机 如 何 对 所 有 人 造成 干扰 。 在 这 种 情况 下 ， 我 们 让 
用 户 内 化 自己 的 负 外 部 性 ， 为 自己 请 求 的 每 一 部 分 数据 (或 在 “ 牧 
场 *» 上 增加 的 每 一 头 “ 牛 ”) 支付 费用 。 更 高 的 价格 市 来 更 低 的 需求 ， 然 
后 我 们 吏 可 以 从 一 开始 避免 “悲剧 ”。 


在 本 书 的 第 一 部 分 ， 依 据 “ 分 至 很 难 ” 的 原则 ， 我 们 讨论 了 两 种 
网 络 ， 蜂 福 和 Wi-Fi。 我 们 每 天 都 在 使 用 这 两 种 网 络 ， 但 往往 不 会 花 
太 多 时 间 去 思考 : 这 么 多 人 如 何 能 既 分 享 空 间 ， 又 不 会 破坏 彼此 的 
通话 或 造成 容量 问题 。 我 们 看 到 远程 调 方 蜂 祸 语 首 网 络 如 何 参 与 到 
技术 中 ， 如 通过 CDMA 实 现 分 布 式 功率 控制 ， 使 每 个 人 能 调整 目 身 
功率 水 平 ， 而 不 会 引起 “军备 竞赛 "。 与 之 相反 ， 我 们 还 看 到 ， 采 用 
随机 接 入 技术 处 理 短 距离 、 不 受 调 和 的 Wi-Fi 网 络 如 何 更 为 可 行 ， 在 


这 种 情况 下 ， 每 个 人 都 试图 通过 感 测 和 退 避 来 避免 碰撞 。 最 后 是 移 
动 数 据 的 情况 ， 我 们 看 到 了 定价 如 何 成 为 实现 网 络 更 高 效 共 至 的 有 
效 方式 。 在 以 上 每 种 情况 中 ， 负 反馈 对 于 确保 用 户 获 得 关于 网 络 条 
件 和 拥塞 的 正确 信号 非常 重要 。 

在 第 11 草 ， 我 们 将 在 讨论 如 何 设计 互联 网 时 ， 回 顾 共 享 和 定价 


问题 。 


与 丹尼斯 -斯 特 里 格 尔 的 对 话 


丹尼斯 斯 特 里 格 尔 征 威 瑞 森 通信 公司 前 总 裁 兼 首席 运 
以 及 威 瑞 条 无 线 公 司 前 总 裁 兼 首席 执行 官 。 


I 


ers 
已 ， 


作者 : 非常 感谢 你 能 抽出 时 间 来 与 我 们 讨论 无 线 网 络 。 我 们 生活 
的 这 个 时 代 ， 人 们 在 每 个 清醒 的 时 刻 都 “呼吸 ”着 无 线 网 络 。 几 十 年 
来 ， 你 在 许多 公司 担任 领导 职务 ， 比 如 作为 威 珊 森 无 线 公 司 的 自 遍 执 
行 官 ， 并 人 负责 做 出 很 多 决策 。 在 过 去 40 年 的 移动 通信 演变 中 ， 最 让 你 
慰 讶 的 部 分 是 什么 ? 


丹尼斯 : 当 你 谈 到 40 年 时 ， 你 让 我 觉得 自己 老 了 ， 但 还 好 。 让 我 
们 从 头 说 起 。 我 记得 当 我 刚 进入 无 线 领域 时 ， 一 个 麦肯锡 公司 的 顾问 
预计 ， 到 世纪 之 交 的 2000 年 将 有 900 000 个 无 线 用 户 。 现 在 ， 我 们 轻易 
超出 这 个 数字 上 百倍 。 如 果 考 虑 到 全 球 的 用 户 ， 规 至 2014 年 年 底 ， 约 
有 3.44 亿 个 ， 所 以 该 行业 的 增长 已 经 远 远 超出 了 麦肯锡 、 贝 尔 实验 室 
和 AT&T 早 期 的 预测 。 我 们 可 以 将 其 归 因 于 优秀 的 网 络 和 对 客户 有 用 
的 好 产品 ， 同 时 由 于 多 年 以 来 价格 不 断 下 降 ， 手 机 已 经 从 公司 高 管 察 
车 后 座 上 的 高 档 装 置 变 成 现在 的 日 常设 备 ， 渗 透 率 (全球 用 户 人 数 ) 
超过 100%， 在 2014 年 年 底 达 到 110%， 这 说 明 很 多 人 都 有 一 台 以 上 的 


设备 。 


事实 上 ， 我 记得 很 久 以 前 ， 我 的 一 个 老板 对 我 说 “你 去 负责 蜂 窜 
公司 吧 ， 我 知道 没有 人 想 干 这 个 。 我 向 你 保证 ， 我 只 会 让 你 在 那里 待 
上 几 年 ， 然 后 就 让 你 回来 ， 掌 管 我 们 的 一 家 大 型 电话 公司 。” 当 时 我 
想 ， 老 板 让 我 干什么 我 就 二 什么。 但 它 有 点 儿 像 - 拍 拍 背 ， 帮 我 们 一 个 
位"， 而 “去 干 一 段 时 间 *” 似 乎 意味 着 它 没有 前 途 。 


作者 : 过 去 几 十 年 市 场 渗透 的 规模 是 最 让 你 惊讶 的 部 分 吗 ? 


丹尼斯 : 不 仅 是 客户 数量 的 规模 ， 而 且 包括 手 机 的 用 途 。 当 然 ， 
语音 消息 和 语音 通话 这 些 无 线 网 络 ， 最 初 的 设计 用 途 多 年 来 一 直 成 倍 
增长 。 但 随 着 数据 的 推出 ， 数 据 业 务 也 迅速 增长 。 截 至 2008 年 (或 
2009 年 ) ， 每 年 的 短信 发 送 数 超过 一 万 亿 条 。 顺 便 说 一 下 ， 我 认为 其 
中 一 半 是 我 的 孩子 发 的 。 但 无 论 如 何 ， 我 记得 20 世 纪 90 年 代 后 期 的 短 
信 ， 当 时 我 的 网 络 工作 人 员 走 过 来 对 我 说 : “看 看 这 个 ， 我 们 可 以 用 手 
机 发 送 文 字 。” 我 说 :“ 谁 会 愿意 这 么 做 呢 ? ”当然 ， 现 在 我 们 可 以 发 图 
片 、 视 频 ， 它 已 经 成 长 为 一 个 了 不 起 的 行业 ， 在 全 球 创 造 并 不 断 创造 
着 许 许 多 多 的 工作 机 会 。 


作者 : 是 的 ， 手 机 使 用 的 规模 和 多 样 性 都 令 人 惊讶 。 你 认为 是 什 
么 在 文 持 这 种 规模 和 多 样 性 呢 ? 


丹尼斯 : 我 认为 主要 有 两 点 ， 首 先是 网 络 的 质量 及 其 随 着 时 间 推 
移 的 改进 。 随 着 更 多 手机 信号 塔 建成 和 无 线 电 频谱 日 益 普 及 ， 这 方面 
的 服务 质量 也 提高 了 。 顺 便 说 一 下 ， 客 户 还 要 求 更 好 的 服务 。 我 们 知 
道 ， 如 果 服 务 仍 维持 在 1984 年 、1990 年 或 者 1995 年 的 水 平 ， 我 们 将 无 
法 大 大 增加 客户 群 。 因 此 ， 我 们 多 年 来 不 得 不 逐步 改进 服务 。 


第 二 点 来 目 定 价 。 以 前 ， 一 台 无 线 电话 设备 本 吴 的 价格 约 为 3 000 
美元 。 为 了 使 其 工作 ， 汽 车 的 后 备 厢 里 还 要 放 一 全 收发 右 。 这 项 服务 
本 刁 的 价格 非常 高 ， 每 月 需要 付 50 关 元 的 基本 费 加 上 通话 一 分 钟 40~50 
美 分 的 使 用 费 ， 这 取决 于 你 打 电话 到 哪里 ， 其 中 还 包括 没有 接听 以 及 
被 挂 断 的 电话 。 该 行业 进入 完全 竞争 时 ， 大 概 是 20 世 纪 90 年 代 中 期 ， 
当时 我 们 有 3、4 或 5 个 竞争 对 手 ， 价 格 降 到 了 无 线 业 务 刚 推出 时 的 很 小 
比例 。 


作者 : 当 你 担任 威 瑞 森 无 线 公 司 的 首席 执行 官 时 ， 在 推出 3G 和 
束 4G 做 出 决策 的 过 程 中 ， 有 很 多 不 同 的 方案 可 供 选 择 。 在 3G / 4G 章 命 


期 间 ， 你 需要 考虑 并 做 出 的 最 具 挑 战 性 的 决定 是 什么 ? 


丹尼斯 : 首先 也 是 最 重要 的 挑战 是 ， 如 何 把 一 部 分 频谱 和 系统 给 
语音 ， 一 部 分 给 数据 ? 这 个 比例 如 何 划 分 才 正 确 ? 当然 ， 一 开始 语音 
业务 比 数据 业务 多 得 多 ， 所 以 我 们 的 工程 师 需要 在 网 络 中 增加 数据 容 
量 ， 包 括 3G 和 4G， 但 4G 的 问题 稍微 复杂 一 点 儿 。 同 时 ， 他 们 必须 不 
断 确 你 ， 数 据 容 量 的 增长 要 和 拥有 手机 并 使 用 这 些 数据 的 客户 增长 保 
持 同 步 ， 并 成 为 网 络 的 一 部 分 。 这 吏 是 工程 方面 的 一 大 挑战 。 


我 们 在 财务 上 面临 的 巨大 挑战 是 ， 我 们 每 年 花费 近 150 亿 美元 在 建 
筑 、 厂 房 和 设备 上 。 其 中 大 部 分 投入 在 网 络 上 ， 如 手机 信号 塔 和 交换 
°。 此 时 的 挑战 也 是 ， 你 应 该 把 钱 花 在 什么 地 方 ? 花 在 数据 部 分 还 是 
花 在 语 首部 分 ， 你 能 继续 保持 每 年 投入 140 亿 、150 亿 、160 亿 美元 吗 ? 
收入 能 证 明 投 入 是 合理 的 吗 ? 财务 方面 真正 的 挑战 在 于 ， 当 时 的 情况 
是 ， 随 着 数据 使 用 量 的 增加 ， 语 音 使 用 量 正 趋 于 平稳 。 所 以 在 21 世 纪 
初 ， 我 们 看 到 的 是 ， 我 们 的 收入 中 来 自 语音 的 部 分 在 减少 ， 来 自 数据 
的 部 分 在 不 断 增 长 。 但 在 当时 ， 大 多 数 的 数据 对 于 客户 来 说 是 相对 便 
宜 的 。 


车 


作者 : 有 的 公司 力 推 WiMAX (全 球 互通 微波 存 取 ) ， 有 的 力 推 
LIE (长 期 演进 技术 ) 。 现 在 显然 ，LTE 已 在 全 球 广泛 部 署 。 威 瑞 森 无 
线 公 司 是 第 一 个 部 署 LTE 的 主要 运营 商 吗 ? 


丹尼斯 : 是 的 。 在 部 署 长 期 演进 方面 ， 我 们 是 第 一 个 ， 是 的 。 


作者 : 但 十 年 前 还 不 清楚 它 的 前 景 如 何 。 关 于 这 个 决定 ， 你 有 什 
么 有 趣 的 故事 吗 ? 


丹尼斯 : 嗯 ， 关 于 哪个 技术 能 最 终生 存 的 问题 ,行业 内 总 是 有 和 争 
议 。WiMAX 与 LIE， 就 像 语 音 业 务 的 GSM 与 CDMA。 原理 一 样 。 而 
且 ， 我 们 认为 CDMA 技 术 总 是 更 符合 成 本 效益 ， 同 时 我 们 也 认为 LIE 


技术 更 具 成 本 效益 。 顺 便 说 一 下 〈 不 是 批评 WiMAX) ， 我 认为 它 是 一 
个 好 服务 ， 但 比 起 LTE， 它 肯定 不 能 以 同样 的 成 本 效 荔 提供 同样 的 速 
度 。 


作者 : 回 到 语音 与 数据 定价 。 仅 仅 几 年 前 ， 在 美国 人 们 通常 会 得 
到 无 限 的 移动 数据 ， 但 只 有 有 限 数量 的 语音 分 钟 和 短信 。 现 在 越 来 越 
难 找 到 无 限 的 移动 数据 。 我 最 近 走 进 一 家 威 瑞 森 的 商店 ， 发 现 一 张 海 
报 上 写 着 : 有 小 /中 /大 /超大 的 家 性 共 译 数据 计划 ， 定 价 大 约 为 10 美 元 
每 干 浪子 市。 世界 各 地 的 许多 其 他 运营 丙 切 换 到 LTE 时 ， 都 开始 实行 
基于 使 用 的 定价 。 是 什么 导致 了 这 种 变化 ? 


丹尼斯 : 很 简单 ， 是 供求 关系 。 以 前 需求 量 用 使 用 时 间 表 示 。 你 
使 用 的 是 语 音 分 钟 ， 你 没有 使 用 数据 分 钟 ， 因 为 它 不 人 存在。 要 么 是 这 
些 应 用 不 存在 ， 或 者 还 没 建 好 ， 要 么 是 我 们 还 没 想到 它 是 多 么 的 方 
便 。 所 以 从 2005 年 (或 2006 年 ) 到 现在 ， 我 们 注意 到 ， 语 音 使 用 分 钟 
已 经 趋 于 平稳 。 现 在 我 们 看 到 的 是 ， 语 首 使 用 分 钟 下 降 ， 而 数据 使 用 
(无 论 用 兆 还 是 于 兆 来 衡量 ) 在 极 大 增加 。 因 此 ， 问 题 变 成 用 户 和 运 
莒 商 如 何 为 网 络 中 的 巨大 投资 支付 费用 ? 但 如 末 你 看 看 你 目前 为 每 兆 
4G 数 据 支付 的 费用 ， 你 会 发 现 ， 它 相 比 3G 已 大 幅 减 少 。 


作者 : 人 们 也 开始 探索 各 种 更 聪明 的 方式 来 为 数据 定价 ， 包 括 如 
基于 网 络 条 件 或 不 同形 式 的 赞助 数据 进行 动态 定价 。 有 企业 推出 了 开 
放 的 无 计 费 服务 ， 它 也 被 称 为 移动 数据 的 1-800 号 码 。 天 于 这 些 和 其 他 
使 移动 数据 的 需求 和 供应 相 匹 配 的 想法 ， 你 认为 定价 革命 将 走向 何 
处 ? 


丹尼斯 :好 吧 ， 让 我 先 补充 说 明 一 下 。 通 常情 况 下 ， 当 你 进行 免 
费 访 问 时 ， 会 有 某 种 隐形 成 本 。 你 经 前 需 要 看 一 则 广告 ， 或 者 看 到 持 
续 不 断 的 弹 窗 广 告 ， 这 可 能 会 荐 恼 你 ， 扰 乱 你 的 思路 ， 所 以 这 是 一 种 
平衡 行为 。 


那么 ， 我 们 将 走 同 何 处 呢 ? 我 可 以 保证 的 一 点 是 使 用 单价 将 继续 
降低 ， 因 为 随 着 使 用 增长 ， 消 费 者 和 两 业 应 用 增长 ， 运 宫 商 的 收入 增 
长 ， 制 造 商 和 运营 商 的 成 本 将 持续 下 降 。 


作者 : 最 近 有 很 多 关于 物 联网 、 我 的 互联 网 和 一 切 事物 的 互联 网 
的 议论 ， 你 甚至 可 以 在 黄金 时 段 的 广告 中 看 到 。 我 们 谈论 的 是 网 络 设 
备 ， 它 们 存在 于 我 们 体内 、 体 表 、 刁 体 周 围 ， 或 城市 、 工 业 和 农业 环 
境 中 等 。 我 们 在 哪里 可 以 找到 第 一 批 主 要 行业 部 门 ， 使 其 实现 飞跃 式 
发 展 ， 并 市 来 最 直接 的 价值 呢 ? 


丹尼斯 : 我 完全 同意 你 对 物 联 网 的 看 法 。 正 如 许多 人 所 说 ， 我 们 
有 微小 的 机 絮 ， 能 以 某 种 方式 、 性 质 或 形式 控制 我 们 的 生活 。 在 几乎 
所 有 可 能 的 方面 ， 无 论 它们 是 否 控 制 我 们 的 城市 以 及 电力 和 照明 的 使 
用 ， 例 如 水 资源 和 公用 事业 ， 或 者 是 否 在 运输 业 看 到 它 ， 这 可 能 是 你 
的 问题 ， 我 们 会 看 到 它 的 第 一 个 地 方 ， 不 一 定 只 是 状 能 汽车 ， 还 有 吞 
能 高 速 公路 ， 你 已 经 开始 看 到 了 。 

至 于 为 什么 物 联 网 在 内 部 垂直 领域 发 展 迅速 ， 原 因 之 一 是 它 不 仅 


方便 快捷 ， 还 降低 了 提供 给 它 的 人 力 成 本 ， 所 以 我 认为 我 们 将 看 到 更 
多 的 物 联网 。 而 且 我 认为 那 不 局 限于 特定 的 垂直 领域 。 


作者 : 比如 说 交通 ， 我 们 看 到 云 服 务 下 降 到 最 终 用 户 或 接近 用 户 
的 边缘 设备 中 ， 形 成 一 张 * 筋 网 ”。 人 们 看 到 这 个 情况 ， 想 知道 由 于 这 
些 网 络 设备 的 物理 距离 接近 ， 现 在 可 以 实现 什么 样 的 应 用 。 与 此 同 
时 ， 人 们 也 在 关注 安全 和 隐私 问题 。 如 有 果 你 看 食物 链 上 不 同 部 分 的 苋 
争 利 益 ， 会 发 现 每 个 人 都 想 成 为 拥有 者 。 苹 采 公 司 和 二 星 公 司 想 说 手 
机 是 这 张 雾 网 的 中 心 ， 而 思科 公司 想 说 ， 它 们 正在 与 汽车 公司 合作 人 研 
发 的 仪表 板 是 中 心 。 


丹尼斯 : 或 者 是 路 由 器 ， 或 者 是 交换 机 ， 或 者 .…… 


作者 : 或 者 威 瑞 森 公 司 会 说 ， 你 旁边 那个 我 控制 的 小 基站 是 中 
心 。 那 么 ， 对 于 网 络 运 崇 商 来 说 ， 什 么 是 一 个 好 的 党 略 ， 这 个 中 心 最 
终 可 能 会 在 哪里 ? 


丹尼斯 : 嗯 ， 我 在 电信 行业 的 同行 不 会 喜欢 我 的 说 法 ， 但 我 认为 
以 当前 的 进程 和 速度 ， 这 个 中 心 最 终 将 是 你 的 设备 ， 在 你 的 口袋 、 钱 
包 和 你 旁边 的 车 里 。 没 有 它 ， 你 束 不 会 离开 家 。 它 几乎 无 时 无 刻 不 在 
你 员 上 。 那 么 运营 两 如 何 与 之 竞争 呢 ? 我 不 确定 。 但 我 认为 对 于 运 宫 
商 来 说 ， 管 案 在 于 合作 ， 无 论 与 苹果 、 合 歌 ， 还 是 和 思科 等 公司 合 
作 ， 甚 至 是 和 制造 商 ， 比 如 爱立信 、 诺 基 亚 合作 。 那 些 拥 有 客户 和 拥 
有 设备 技术 的 人 ， 必 须 走 到 一 起 。 


威 珊 森 公司 今天 有 个 很 大 的 优势 。 它 有 超过 1 亿 个 客户 。 现 在 ， 合 
歌 可 能 会 说 目 己 有 这 么 多 的 搜索 服务 使 用 者 ， 但 不 能 说 目 己 有 这 么 多 
客 尸 。 现 在 ， 我 有 一 台 苹 果 手 机 ， 但 我 的 苹果 手机 是 连接 到 威 瑞 森 无 
线 网 络 的 。 谁 为 此 疝 我 收费 呢 ? 苹果 公司 也 许 会 收 一 次 费 ， 但 威 瑞 森 
无 线 每 个 月 都 收费 。 因 此 ， 在 这 个 等 式 的 两 边 ， 双 方 会 以 某 种 方式 、 
性 质 或 形式 争夺 客户 ， 同 时 它们 也 成 为 伙伴 走 到 一 起 。 我 们 正 处 于 这 
一 切 的 开端 。 


作者 : 我 还 有 最 后 一 个 问题 ， 也 许 与 国家 政策 有 关 ， 也 受到 我 们 
刚刚 谈 到 的 这 些 应 用 和 需求 的 驱使 。 美 国联 邦 通讯 委员 会 宣布， 美国 
在 2014 年 正式 陷入 频谱 赤字 。 我 们 的 频谱 用 完了 吗 ? 如 采 是 这 样 ， 我 
们 在 频谱 短缺 的 未 来 该 如 何 生活 ? 


丹尼斯 : 我 一 个 字 也 不 相信 。 无 论 是 在 美国 还 是 在 全 世界 ， 都 不 
存在 频谱 短缺 的 问题 。 事 实 古 ， 目 前 已 有 的 频谱 比美 国 公司 能 使 用 的 
更 多 。 面 临 的 挑战 是 ， 它 在 错误 的 人 手中 。 它 在 政府 和 政府 机 构 手 
中 ， 它 们 不 愿意 在 任何 情况 下 放弃 频谱 。 它 们 对 频谱 的 使 用 非常 低 


效 ， 而 且 政 府 必须 认识 到 ， 它 们 对 使 用 频谱 的 部 署 效 率 必 须 和 商业 部 
鸭 的 效率 一 样 高 。 如 有 果 它 们 这 样 做 ， 束 不 会 看 到 频谱 短缺 。 


作者 : 所 以 你 认为 问题 的 核心 是 使 用 效率 ， 而 不 是 频谱 本 身 的 短 
缺 ? 


丹尼斯 : 在 政府 中 有 很 多 人 会 和 我 争论 这 个 ， 但 我 已 经 担任 这 个 
职位 很 多 年 了 ， 而 且 相 比 已 经 使 用 的 频谱 量 ， 已 经 被 拍卖 斥 、 用 于 商 
业 目 的 的 频谱 量 微不足道 。 顺 便 说 一 下 ， 广 播 公 司 使 用 频谱 的 效率 也 
不 高 ， 所 以 效率 问题 丈 在 于 此 。 


作者 : 非常 感谢 你 ， 丹 尼 。 这 是 一 次 非常 有 启发 性 的 谈话 ， 谢 谢 
你 分 享 你 的 观点 。 不 管 未 来 怎样 ， 都 会 同样 精彩 。 


第 二 部 分 


排序 很 难 


在 第 一 部 分 ， 我 们 看 到 了 在 多 个 用 户 之 间 有 效 地 划分 共 至 资源 
是 多 么 的 具有 挑战 性 。 现 在 ， 在 第 二 部 分 ， 我 们 把 注意 力 转向 网 络 
中 的 另 一 个 挑战 : 如 何 找到 一 组 项 目的 合适 排序 。 我 们 特别 关注 谷 
歌 使 用 的 排序 方法 : 不 断 更 新 网 页 向 网 站 的 每 个 访问 者 显示 的 顺 
序 。 事 实 上 ， 合 歌 有 两 种 不 同 “ 类 型 * 的 页 面 ， 占 据 广告 空间 的 页 面 


以 及 显示 为 搜索 结 采 部 分 的 页 面 。 我 们 将 分 别 在 第 4 章 和 第 5 章 讨论 
这 两 个 主题 。 正 如 你 将 看 到 的 ， 完 全 不 同 的 技术 可 用 于 项 目 排序 ， 
广告 空间 基于 苋 价 被 分 配给 购买 者 ， 而 搜索 结 采 会 根据 重要 性 和 相 
天 性 进行 排序 。 


第 4 章 
苋 标 广告 空间 


如 果 你 在 过 去 10 年 中 上 过 网 ， 你 就 一 定 用 过 谷歌 搜索 引擎 〈 见 图 
4-1) 。 我 们 “谷歌 最 近 的 咖啡 店 到 搜索 大 学 课程 的 详 
ee 。2006 年 ,，“ 合 歌 搜 索 ” 作 为 一 个 词 被 收录 到 《牛津 英语 字典 》 

。 一 大 部 分 读者 可 能 一 开始 也 是 由 谷歌 介绍 而 选择 本 书 的 。 


(oodgle 


图 4_1 无 处 不 在 的 谷歌 标志 性 商标 
谷歌 拥有 超过 55 000 名 员工 ，2014 年 的 收入 为 660 亿 美元 ， 比 上 一 
年 增长 199%。 那 么 谷歌 是 如 何 对 网 页 进行 排序 的 ? 它 又 是 如 何 从 其 广 
告 业 务 中 赚钱 的 ? 


在 线 广告 业务 


麦 格 纳 环球 公司 估计 ，2015 年 全 球 在 线 广告 行业 创造 的 收入 超过 1 
600 亿 美元 。 其 中 ，2014 年 谷歌 仅 从 广告 就 获得 近 90% 的 收入 ， 只 有 大 
约 10% 的 收入 来 自 其 他 业务 ， 如 谷歌 游戏 、 合 歌 应 用 程序 和 谷歌 光 
纤 ， 如 图 4-2 所 示 。 这 些 广告 是 如 何 运 行 的 ? 


10.5% 


图 4-2 谷歌 2014 年 的 大 致 收入 来 源 
注 : 约 68% 来 自 谷歌 自己 网 站 上 的 广告 ， 还 有 约 21% 来 自 合作 伙伴 网 站 上 的 广告 。 只 有 约 11% 
来 自 广告 以 外 的 业务 ， 虽 然 这 些 来 源 每 年 所 占 的 比例 在 逐渐 上 升 


如 何 计 费 ? 


在 线 广 告 的 起 源 可 以 追溯 到 互联 网 时 代 早 期 (20 世纪 90 年 代 中 
期 ) 。 显 示 广 告 的 页 旗 最 初 由 网 站 ( 即 卖 家 ) 基于 每 千 次 印象 
(pay-per-thousand-impressions) 出 售 给 广告 客户 〈 即 买 家 ) 
这 意味 着 ， 每 当 买 方 的 页 旗 累 积 到 1 000 个 新 的 访问 ， 广 告 客户 就 将 支 

付 给 卖方 预先 确定 的 金额 。 


这 真 的 是 向 广告 商 收 费 的 最 佳 方式 吗 ? 当然 ， 看 到 一 则 广告 并 不 
能 保证 人 们 会 点 击 它 ， 更 不 用 说 让 他 们 从 上 面 买 东西 。 因 此 ， 这 种 方 
法 只 能 在 一 定 程度 上 表明 ， 发 布 广告 会 给 广告 客户 读 来 多 少 利益 。 


那么 如 果 根 据点 击 计 费 ， 而 不 是 访问 昵 ? 1998 年 ， 搜 索引 警 公 司 
GoTo 开 始 提供 这 种 选择 。 在 该 模式 中 ， 广 告 客户 提交 竞拍 出 价 ， 以 决 
定 他 们 愿意 支付 多 少 费 用 来 出 现在 搜索 结果 页 面 的 顶部 (在 特定 的 搜 
索 查 询 中 ) 。 这 些 报 价 基于 点 击 付 费 (pay-per-click) : 每 次 有 人 


点 击 GoTo 页 面 的 链接 ， 跳 转 到 它们 的 网 站 上 ， 广 告 商 就 会 支付 它们 的 
出 价 金 额 。GoTo 提 供 的 搜索 结果 列表 按照 点 击 支付 出 价 金 额 降序 排 
列 ， 如 图 4_3 所 示 。 


本 的 面包 房 
来 买 这 一 高 最 好 的 烘焙 食品 。 
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马 特 的 市 场 

70 个 评论 :“ 哇 。 这 是 一 个 
幸运 的 周边 发 现 。” 

Il 

加 比 的 杂货 店 

| a 我 们 今天 营业 ! 来 狂 
' 这 一 带 最 棒 的 杂货 店 。 
| 


图 4-3 搜索 结果 页 面 的 一 个 小 例子 


查询 词 是 “食品 店 ”， 所 以 出 现 的 链接 与 食品 购买 有 关 。 广 告 顺序 根据 广告 商 为 第 一 个 位 
置 册 价 多 少 排 下 ， 术 的 摆 包 房 出 价 最 高 ， 为 5 美元 ， 其 次 是 马 特 的 市 场 (3 美元 ) 和 加 比 的 杂 


货 店 (1 美元 ) 。 因 此 ， 每 当 有 人 点 击 他 们 的 链接 ， 这 些 商店 将 分 别 支 付 5 美元 、3 美 元 和 1 美 
元 


GoTo 创 造 了 所 谓 的 赞助 商 搜 索 模 式 ， 这 种 模式 也 被 称 为 搜索 广 
告 (search ads) 。GoTo 于 2001 年 改名 为 Overture， 并 在 2003 年 被 雅 


虎 收 购 ， 雅 虎 开 始 以 它 发 展 搜索 营 销 服务 。 在 世纪 之 交 时 ， 另 一 家 搜 
索引 警 公 司 谷歌 也 已 经 开始 普遍 使 用 点 击 付费 广告 模式 。 谷 歌 公司 成 
立 于 1998 年 ， 并 在 2000 年 建立 了 AdWords 部 门 ， 负 责 公 司 的 广告 业 
务 。 在 当时 ，AdWords 开 始 提 供 关 键 词 广告 服务 ， 根 据点 击 付费 定 
价 ， 这 成 为 谷歌 搜索 引擎 的 特点 。 


目 那 时 以 来 ， 谷 歌 已 成 为 迄今 为 止 最 大 的 搜索 广告 提供 商 。 根 据 
eMarketer 的 数据 ， 合 歌 在 2014 年 拥有 55% 的 市 场 份额 。 百度 是 该 行业 
中 的 第 二 大 公司 ， 其 市 场 份额 不 足 8%。 我 们 现在 具体 看 看 AdWords 。 


在 线 广 告 


假设 你 想 通 过 谷歌 搜索 为 你 的 网 站 做 广告 。 通 过 AdWords， 你 可 
以 输入 要 显示 的 内 容 ， 包 括 你 的 网 站 链接 和 一 些 描述 性 文字 ， 并 为 广 
告 设置 一 些 关 键 词 。 这 些 信息 将 被 发 送 到 谷歌 的 数据 库 ， 广 告 将 被 创 
建 : 当 有 人 在 谷歌 搜索 栏 中 进行 查询 ， 并 且 包含 和 广告 相关 的 文字 ， 
你 的 广告 就 可 能 会 出 现在 搜索 结果 中 。 


当 一 个 关键 词 或 一 组 关键 词 ) 被 输入 到 谷歌 搜索 栏 时 ， 你 可 能 
会 注意 到 ， 合 歌 实际 上 显示 了 两 样 东 西 : 一 个 是 搜索 结 采 的 标准 列 
表 ， 男 一 个 十 与 大 询 关键 词 匹 配 的 广告 列表 。 你 可 以 在 图 4-4 中 看 到 一 
个 包含 这 两 种 类 型 结果 的 典型 搜索 布局 (截至 2015 年 ) 。 标 准 搜索 结 
果 显 示 在 页 面 的 中 间 ， 而 赞助 广告 则 显示 在 页 面 的 边缘 :顶部 、 矿 侧 
面板 或 底部 。 


和 


图 4-4 

注 : 在 谷歌 搜索 页 面 中 〈2015 年 ) ， 标 准 搜索 结果 ( 左 图 ) 通常 显示 在 页 面 的 中 间 ， 而 赞助 
广告 ( 右 图 ) 则 显示 在 页 面 的 边缘 

试 试 输入 些 内 容 到 谷歌 搜索 栏 。 作 为 范例 ， 我 们 于 2015 年 6 月 输 
入 “在 线 教育 ” 《顺便 说 一 句 ， 我 们 将 在 第 8 章 对 其 进行 讨论 ) 。 除 了 显 
示 10~15 个 链接 到 某 些 在 线 项 目 和 排行 的 标准 搜索 结果 ， 谷 歌 还 基于 天 
键 词 ， 在 顶部 和 右 侧 面板 显示 广告 。 顶 部 的 第 一 个 广告 是 凤凰 城 大 学 
(www.phoenix.edu/Education? ) 。 这 个 位 置 和 右面 板 顶 部 的 位 置 估计 
会 获得 最 多 的 点 击 量 ， 是 你 的 广告 出 现 的 理想 位 置 。 


你 的 广告 会 被 放 在 列表 中 的 哪个 位 置 ， 取 决 于 你 愿意 支付 多 少 觉 
助 费 ， 以 及 疯 价 分 配 结 采 。 在 范 价 中 ， 你 和 其 他 选择 这 些 关 键 词 的 人 
忠 是 部 价 者 。 在 竞价 结束 时 ， 出 价 最 高 的 人 将 得 到 最 好 的 位 置 ， 出 价 
第 二 融 的 得 到 第 二 好 的 位 置 ， 以 此 类 推 。 我 们 将 在 本 章 介 绍 不 同 的 竞 
价 机 制 。 

广告 商 什么 时 候 向 谷歌 付费 ? 通过 点 击 付费 ， 每 次 有 人 点 击 广 


告 ， 合 歌 都 会 得 到 报酬 。 一 个 广告 位 置 在 比如 1 小 时 内 被 访问 者 点 击 的 
平均 次 数 称 为 点 击 率 《click-through rate) 。 广 告 商 向 谷歌 支付 的 


| 


费用 与 广告 的 点 击 率 成 正比 ， 因 为 点 击 率 体现 谷歌 提供 的 价值 〈 见 图 


4_5) 
_\/ 点 击 
A 


图 4-5 


注 : 广告 位 置 的 点 击 率 可 以 衡量 一 段 时 间 内 预期 的 访问 次 数 ， 是 广告 客户 况 价 时 的 重要 考虑 
因 系 


广告 商 能 从 中 得 到 什么 ? 它们 可 以 预计 从 广告 的 每 次 点 击 中 获得 
的 平均 收入 。 根 据 产品 的 点 击 率 (每 小 时 点 击 次 数 ) 和 每 次 点 击 的 收 
入 ， 广 告 客户 能 预计 从 某 个 广告 位 置 获得 的 收入 ， 这 是 广告 位 置 对 于 
买 家 的 估 值 (valuation) 。 每 个 广告 客户 将 对 各 个 位 置 有 不 同 的 估 
值 。 


例如 ， 假 设 一 个 广告 位 置 每 小 时 获得 20 次 点 击 ， 并 且 每 次 点 击 
后 ， 访 问 者 都 有 50% 的 概率 会 购买 一 个 商品 。 如 有 果 商 品 的 平均 售 价 为 
70 美 元 ， 这 个 位 置 对 于 广告 客户 的 估 值 是 多 少 ? 其 预期 收入 为 : 

点 击 购买 美元 美元 


; - 
人 小 时 a 点 击 “0 购买 人 小 时 


公开 苋 价 


正如 我 们 所 说 ， 谷 歌 通过 广告 竞价 (auctions) 向 买 家 出 售 广告 
空间 。 在 一 般 情 况 下 ， 一 次 竞价 有 不 同 竞价 人 、 项 目 和 卖家 ， 但 我 们 
只 关注 单一 卖方 的 情况 ， 因 为 谷歌 是 这 里 的 单一 卖方 。 


尽管 拍卖 手段 的 普及 ， 在 很 大 程度 上 得 益 于 互联 网 的 兴起 ， 但 在 
谷歌 时 代 之 前 的 几 个 世纪 ， 担 卖 就 已 经 被 用 来 作为 商品 交易 的 一 种 手 
段 。 历 史上 ， 从 马 和 牲畜 到 房地产 和 人 整个 帝国 ， 都 曾 被 作为 拍卖 标的 
物 放 到 拍卖 台 上 “。 最 早 的 拍卖 可 以 追溯 到 公元 前 500 年 。 一 个 〈 相 对 较 
近 的 ) 例子 是 ， 在 美国 南北 战争 期 间 (1861 一 1865 年 ) ， 被 军队 缴获 
的 商品 通过 当地 指挥 上 校 拍卖 出 售 。 因 此 ， 今 天 美国 的 一 些 拍卖 商 被 
称 为 “< 上校 ”。 


提 到 拍卖 ， 你 可 能 会 想到 一 个 公共 场所 ， 里 面 有 一 个 招 卖 人 和 多 
个 投标 人 ， 如 图 4-6 所 示 。 拍 卖 人 站 在 被 折 卖 物品 的 券 边 ， 协 调 折 卖 过 
程 ， 被 一 群 范 扫 者 包围 。 
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” ”图 4_6 传统 、 开 放 、 公 开 的 拍卖 厅 


这 种 拍卖 中 每 个 人 的 出 价 都 被 公开 宣布 ， 称 为 公开 拍卖 (open 
auction) 。 公 开拍 卖 有 两 种 主要 类 型 : 增 价 和 降价 。 在 增 价 拍卖 
(ascending price auction) 中 ， 拍 卖 人 首先 宣布 标底 ， 然 后 任何 
投标 人 都 可 以 举 手 并 提出 更 高 的 价格 。 拍 卖 人 可 能 会 说 : “拍卖 从 10 美 
元 开始 ! 有 出 10 美 元 的 人 吗 ? ”然后 有 人 举 起 手 说 : “我 们 出 10 美 元 ， 
有 人 超过 10 美 元 吗 ? ”然后 有 人 出 20 美 元 ， 以 此 类 推 ， 直 到 没有 人 出 更 
高 的 价 。*100 美 元 一 次 ， 两 次 ， 成 交 ! ”最 后 一 个 投标 人 获得 该 物品 ， 
并 支付 其 最 新 的 出 价 。 


增 价 拍 卖 是 我 们 最 熟悉 的 拍卖 方式 。 相 比 之 下 ， 在 降价 拍卖 

(descending price auction) 中 ， 拍 卖 人 首先 宣布 一 个 高 价格 ， 高 

到 没有 人 会 接受 。 然 后 拍卖 人 逐渐 降低 价格 ， 直 到 有 一 个 投标 人 
喊 :“ 买 ! ”该 投标 人 会 获得 该 物品 ， 并 文 付 拍卖 终止 时 的 价格 。 


公开 担 卖 使 用 得 相当 频 迷 ， 但 谷歌 等 搜索 广告 赞助 商 不 用 这 种 方 
式 。 与 公开 竞拍 相对 的 是 私下 提交 的 投标 ， 被 称 为 密封 (sealed- 
envelope) 拍卖 ， 它 在 许多 场合 中 更 为 实际 。 接 下 来 我 们 将 对 其 进行 
具体 讨论 。 


密封 拍卖 


谷歌 使 用 特定 类 型 的 密封 拍卖 将 广告 位 置 分 配给 投标 人 。 在 考虑 
个 项 目 (例如 多 个 广告 位 置 ) 之 前 ， 让 我 们 先 看 看 单一 项 目的 拍 


闪避 


在 密封 招 卖 中 ， 每 个 投标 人 私下 提交 投标 ， 所 有 投标 同时 向 拍卖 
人 显示 ( 见 图 4-7) 。 然 后 ， 拍 卖 人 决定 如 何 匹 配 (matching) ”( 即 
分 配 ) 和 收费 。 匹 配 部 分 很 容易 ， 出 价 最 高 者 得 到 拍卖 品 。 但 收取 的 
金额 会 有 所 不 同 ， 这 取决 于 它 是 什么 类 型 的 密封 担 卖 : 


投标 人 A 


Bx 


范 价 A 


投标 人 B 
= 
投标 人 C 竞价 C 图 拍 去 人 


竞价 D 


投标 人 DD 


让 密封 拍卖 中 ， 每 个 投标 人 (A、B、C...……..) ee 担 卖 结果 是 明确 
昌 卖 品 将 由 出 价 最 高 的 人 获得 。 决 定 出 价 多 少 更 为 复 


.在 第 一 价格 拍卖 (first-price 中 ， 获 胜 者 支付 
目 己 给 出 的 最 高 出 价 。 


.在 第 二 价格 拍卖 (second-price auction) 中 ， 获 胜 者 支 
付 第 二 高 的 出 价 。 


你 可 以 在 图 4-8 中 看 到 两 种 拍卖 的 差异 。 凯 特 获 得 吉他 ， 最 高 出 价 
为 800 美 元 。 根 据 第 一 价格 ， 她 将 支付 目 己 的 出 价 800 美 元 。 根 据 第 二 
价格 ， 她 将 支付 第 二 高 出 价 ( 克 里 斯 的 ) 750 美 元 。 


注 : 第 一 和 第 二 价格 密封 拍卖 的 区 别 在 于 ， 获 胜 者 文 付 多 少 


750 美 元 获胜 者 : 山特 


E\ 


第 一 价格 800 美 元 
第 二 价格 750 美 元 


图 4-8 


金额 


为 什么 有 人 会 使 用 第 二 价格 扣 卖 呢 ? 乍 一 看 ， 这 似乎 不 对 劲 儿 。 


如 果 我 想 要 一 件 担 卖 品 ， 同 时 我 知道 郑 家 将 支付 第 二 高 出 价 ， 为 什么 


不 提出 一 个 非常 高 的 金额 ， 远 高 于 我 目 身 对 该 担 卖 品 的 佑 值 呢 ? 


事实 证 明 ， 这 种 直觉 实际 上 是 错误 的 。 原 因 很 简单 : 如 果 每 个 人 


都 采取 同样 的 思维 ， 那 么 “第 二 高 出 价 ” 也 将 是 非常 高 的 。 因 此 ， 获 胜 
者 将 为 拍卖 品 文 付 比 其 目 身 佑 值 高 得 多 的 金额 。 了 解 到 这 一 点 ， 每 个 
人 束 不 会 提出 比 其 真正 信 值 更 高 的 芝 价 ， 以 避免 文 付费 用 超过 拍卖 品 


价值 。 下 面 我 们 对 此 进行 详细 讨论 。 


第 二 价格 是 合理 的 


归根 结 底 ， 投 标 人 参加 拍卖 的 目标 是 使 其 回报 (payoff) 最 大 
化 ， 也 就 是 他 获得 的 净 收 益 。 如 果 投 标 人 最 得 担 卖 品 ， 其 回报 是 他 的 
佑 值 和 文 付 价格 之 间 的 差异 ; 


回报 = 估 值 -支付 价格 


然而 ， 如 果 他 没有 成 功 ， 回 报 就 是 零 。 回 报 实际 上 是 净 效 用 的 一 
种 特殊 情况 ， 我 们 曾 在 第 3 章 中 讨论 过 。 


回报 会 是 负数 吗 ? 当然 。 文 付 价格 可 能 比 佑 值 更 高 。 这 和 古 投 标 人 
总 想 避 免 的 情况 ， 因 为 在 这 种 情况 下 ， 他 宁愿 不 要 该 招 卖 品 。 


投标 人 如 何 最 大 限度 地 提高 自己 的 回报 ? 这 取决 于 拍卖 的 类 型 。 
首先 考虑 第 一 价格 密封 拍卖 的 情况 。 在 这 种 情况 下 ， 顾 家 的 回报 是 什 
么 ? 由 于 他 为 拍卖 品 文 付 的 价格 是 他 目 己 的 出 价 ， 因 此 他 的 回报 是 其 
对 拍卖 品 的 佑 值 减 去 出 价 。 一 般 来 说 ， 人 们 很 难 决定 应 该 出 价 多 少 ， 
以 争取 回报 最 大 化 ， 因 为 他 们 十 否 获胜 取决 于 其 他 人 的 策略 。 但 有 一 
点 是 明确 的 : 在 这 种 类 型 的 担 卖 中 ， 每 个 人 的 出 价 应 该 总 是 低 于 其 个 
人 人 和信 值 ， 因 为 如 果 不 这 样 ， 顾 得 拍卖 品 只 能 带 来 非 正面 的 回报 ( 即 为 


零 或 小 于 零 ) 。 


第 二 价格 招 卖 的 情况 如 何 ? 在 这 种 情况 下 ， 获 胜 者 将 文 付 第 二 高 
出 价 ， 所 以 他 的 回报 是 其 估 值 减 去 这 个 数字 。 这 种 拍卖 方式 鼓励 诚实 
的 投标 (truthful bidding) ， 意 味 着 对 于 每 个 人 来 说 ， 最 好 的 策略 
不是 在 出 价 时 提交 真实 估 值 。 


为 什么 ?因为 改变 出 价 不 能 提高 回报 。 这 个 道理 类 似 于 为 什么 基 
于 使 用 的 定价 鼓励 用 户 基于 需求 曲线 进行 消费 ， 正 如 我 们 在 第 3 章 中 看 
到 的 那样 。 


要 理解 这 一 点 ， 可 以 假设 你 在 竞拍 一 件 物品 ， 你 对 其 真正 的 售 值 
征 50 美 元 。 你 考虑 提交 真实 佑 值 作 为 你 的 出 价 ， 但 还 有 两 个 选择 : 提 
高 或 降低 出 价 ， 如 图 4-9 所 示 。 甫 先 ， 如 果 你 决定 降低 出 价 ， 比 如 说 降 
到 45 美 元 ， 你 的 回报 会 怎 么 样 ? 在 第 二 价格 招 卖 中 ， 能 改变 结 采 的 唯 
一 办 法 是 ， 如 果 你 本 来 要 属 ， 然 后 你 把 价格 降 到 足够 低 ， 让 第 二 高 出 
价 者 说 得 该 招 卖 品 。 也 许 此 人 出 价 为 48 美 元 。 本 来 ， 你 的 回报 应 为 
正 : 你 要 付 第 二 高 出 价 48 美 元 ， 你 的 回报 为 50 美 元 - 48 美 元 = 2 美元 。 
但 现在 你 输 掉 了 拍卖 ， 你 的 回报 是 零 ! 你 本 应 该 提交 真实 的 佑 值 ， 
为 正 回报 比 零 回报 要 好 。 


降低 出 价 提高 出 价 


之 前 的 


你 获胜 
回报 : -3 美元 


图 4-9 
注 : 在 第 二 价格 密封 拍卖 中 ， 如 实 出 价 符合 你 的 最 佳 利益 。 提 高 或 降低 出 价 只 会 减少 你 的 回 


另 一 方面 ， 如 果 你 把 出 价 提高 到 55 美 元 ， 会 发 生 什 么 呢 ? 能 改变 
结果 的 唯一 方法 是 ， 如 果 你 本 来 要 和 输 掉 拍卖 ， 但 你 将 出 价 提 到 足够 
高 ， 使 你 胜出 ， 导 致 以 前 出 价 最 高 的 投标 人 失败 。 假 设 这 个 人 出 价 53 
美元 。 本 来 ， 你 的 回报 为 零 。 现 在 ， 你 赢得 了 这 件 物品 ， 并 支付 53 美 
元 ， 这 意味 着 你 的 回报 是 50 美 元 - 53 美 元 = -3 美元 。 此 值 为 负 值 ， 


为 你 的 估 值 低 于 第 二 高 出 价 。 在 这 种 情况 下 ， 你 也 应 该 提交 你 的 真 
估 值 ， 因 为 零 回报 比 负 回报 好 。 


因此 ， 第 二 价格 拍卖 比 第 一 价格 招 卖 “ 更 好 ”， 原 因 在 于 ， 它 使 如 
实 出 价 符合 每 个 人 的 最 佳 利 益 。 买 家 思考 应 该 如 何 出 价 时 ， 有 一 个 隐 
向 的 反馈 信号 ， 或 励 其 将 出 价 设 为 其 目 身 的 估 值 。 切 断 获 胜 者 人 选 和 
辜 家 文 付 价格 之 间 的 联系 是 有 用 的 。 


第 二 价格 比 诸如 第 三 、 第 四 或 第 五 价格 拍卖 的 情况 好 吗 ? 事实 证 
明 ， 只 有 第 二 价格 才能 使 每 个 使 用 者 控制 自己 对 网 络 施 加 的 负 外 部 
性 : 如 果 不 考 虑 拍卖 的 赢家 ， 那么 第 二 高 出 价 者 将 胜出 。 这 样 ， 赢 家 
获胜 是 因为 出 价 第 二 高 的 投标 人 没有 获胜 ， 因为 获胜 者 的 支付 金额 是 

第 二 高 的 出 价 。 


正如 第 1 章 的 分 布 式 功率 控制 和 第 3 章 的 基于 使 用 的 数据 定价 ， 第 
二 价格 拍卖 同样 说 明 ， 通 过 回 用 户 发 送 关 于 其 影响 的 信号 ， 迫 使 其 内 
化 目 己 的 负 外 部 性 ， 在 网 络 中 十 一 个 并 见 的 主题 。 


一 些 意 想不到 的 联系 


在 图 4-10 中 ， 你 可 以 看 到 我 们 讨论 过 的 单一 项 目 拍卖 的 分 类 示意 
图 。 它 们 之 间 有 一 些 有 趣 的 相似 之 处 。 首 先 ， 考 虑 增 价 公 开拍 卖 。 当 
出 价 提高 时 ， 所 有 投标 者 心中 都 有 目 己 的 估 值 ， 每 个 人 部 将 继续 竞 
担 ， 直 到 出 价 高 于 其 估 值 。 当 前 出 价 会 不 断 上 升 ， 直 到 佑 值 第 二 高 的 
投标 人 选择 放弃 。 所 以 ， 除 非 启 家 大 幅 增 加 目前 的 出 价 ， 否 则 其 将 文 
付 第 二 高 出 价 人 的 估 值 “加 上 些许 增幅 ) 。 这 样 ， 增 价 拍卖 与 第 二 价 
格 担 卖 类 似 。 


单一 项 目 拍卖 
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图 4-10 我 们 讨论 过 的 单一 项 目 拍卖 的 分 类 示意 图 


现在 考虑 降价 公开 拍卖 。 拍 卖 人 不 断 降低 价格 ， 直 到 价格 降 至 最 
高 出 价 者 的 水 平 ， 此 时 最 高 出 价 者 将 终止 拍卖 。 只 要 该 出 价 者 不 等 价 
格 进一步 下 降 〈 也 束 是 持 讶 慎 态 度 ) ， 他 就 将 支付 自己 的 估 值 ， 这 是 
最 高 价格 。 这 样 ， 降 价 折 卖 相 当 于 第 一 价格 拍卖 


有 些 单一 项 目 拍卖 既 不 严格 封闭 ， 也 不 严格 公开 。 例 如 ， 在 亿 贝 
的 拍卖 中 ， 投 标 人 通过 报价 了 解 当 前 最 高 出 价 ， 这 是 下 一 个 出 价 能 被 
接受 的 最 低 值 。 虽 然 投 标 人 不 能 确定 最 高 出 价 是 多 少 ( 即 不 严格 的 公 
开拍 卖 ) ， 但 他 们 能 了 解 拍 卖 的 当前 状态 〈 即 不 严格 的 封闭 拍卖 ) 的 
信息 。 因 此 ， 亿 贝 位 于 中 间 地 带 ， 在 整个 过 程 中 将 部 分 反馈 发 给 每 个 
投标 人 。 关 于 亿 贝 拍卖 及 其 运行 方式 的 示例 ， 请 参考 本 书 网 站 Q4.1 和 
Q4.2 部 分 。 


广义 二 价 拍卖 


鉴于 谷歌 等 搜索 广告 公司 有 多 个 广告 位 置 出 售 ， 它 们 的 拍卖 实际 
上 是 多 项 目 招 卖 ， 即 有 多 个 项 目 (广告 ) 提供 给 投标 人 。 让 我 们 尝试 
用 一 个 简单 的 方法 ， 将 单一 项 目 密封 拍卖 应 用 于 谷歌 关键 词 广告 。 


图 4-11 显 示 ， 有 三 个 广告 客户 ( 即 投标 人 ) 和 三 个 广告 位 置 。 每 
个 投标 人 (安娜 、 本 和 查理 ) 对 每 次 点 击 收 入 有 不 同 的 预期 ， 同 时 每 
个 广告 位 置 (1、2 和 3) 有 不 同 的 点 击 率 。 一 个 特定 的 广告 位 置 对 于 投 
标 人 的 估 值 ， 等 于 点 击 率 乘 以 每 次 点 击 的 预期 收入 。 这 样 总 共有 9 个 不 
同 的 估 值 ， 例 如 ， 本 对 于 位 置 3 的 预期 收入 (每 小 时 ) 为 40 美 元 x1 = 
40 美 元 。 


次 点 人 。 a 
四 投标 人 广告 位 置 点 击 率 
LI 

安娜 ”@ . EE= 下 = 本 10 


0 者 理 @ [一 一 


图 4-11 谷歌 广告 拍卖 示例 
注 : 有 三 个 投标 人 (安娜 、 本 和 查理 ) 和 三 个 广告 位 置 (1、2 和 3) 


为 了 参与 拍卖 ， 广 告 客 户 要 提供 给 谷歌 什么 ? 他 们 的 每 次 点 击 收 
入 《或 者 更 准确 地 说 ， 他 们 对 每 次 点 击 的 佑 值 ) 。 有 趣 的 是 ， 谷 歌 只 
会 从 每 个 广告 客户 那里 获得 一 个 数字 ， 而 不 是 对 每 个 广告 位 置 都 有 一 
个 数字 。 这 表明 ， 无 论点 击 来 目 哪 个 位 置 ， 它 对 相同 买 家 的 价值 都 是 
一 样 的。 但 是 ， 买 家 可 能 对 第 一 个 广告 位 置 佑 值 为 每 次 点 击 100 美 元 ， 
对 第 二 个 的 佑 值 只 有 每 次 点 击 95 美 元 ， 因 为 点 击 接近 顶端 的 位 置 可 能 
有 更 高 的 机 会 促成 购 买 。 为 简便 起 见 ， 赞 助 搜索 行业 认为 ， 一 个 数字 
束 够 了 。 


多 项 目 拍 卖 将 给 每 个 广告 客户 分 配 一 个 单独 的 广告 (如果 买 家 比 
位 置 数 更 多 ， 或 位 置 数 比 买 家 更 多 ， 这 只 会 导致 一 些 广 告 客 户 没 有 位 
置 ， 或 产生 一 些 空位 置 ) 。 对 于 广告 位 置 的 分 配 和 收费 ， 合 歌 关 键 词 
广告 使 用 广义 二 价 (generalized second-price, 简称 GSP) 拍卖 : 


* 由 广告 客户 出 价 : 每 个 买 家 提交 一 个 出 价 ， 这 是 他 们 愿意 为 
每 次 点 击 文 付 给 谷歌 的 价格 。 

* 由 谷歌 匹配 : 广告 位 置 按 出 价 降序 分 配给 买 家 。 所 以 ， 出 价 
最 高 者 得 到 第 一 个 广告 位 置 ， 第 二 高 者 得 到 第 二 个 位 置 ， 以 此 类 
推 。 

“广告 客户 辐 谷 歌 文 付 : 每 个 严 家 为 广告 位 置 文 付 价格 的 方 
法 ， 束 古 我 们 看 到 的 第 二 价格 、 单 一 项 目 拍卖 方式 。 最 高 投标 人 文 
付 的 价格 ， 征 第 二 高 出 价 者 愿意 为 第 一 个 位 置 文 付 的 价格 ， 第 二 高 
出 价 者 支付 的 价格 ， 是 第 三 高 出 价 者 愿意 为 第 二 个 位 置 支付 的 价 
格 ， 以 此 类 推 。 


有 了 这 种 方法 ， 我 们 来 看 看 图 4-11 中 拍卖 的 结果 。 假 设 每 个 投标 
人 的 出 价 生 其 真实 估 值 ， 安 娜 、 本 和 查理 将 分 别提 区 每 次 点 击 20 类 
元 、40 美 元 和 10 美 元 作为 他 们 的 出 价 。 哪 些 位 置 将 分 配给 他 们 ? 根据 
广义 二 价 ， 出 价 最 高 者 获得 最 有 价值 的 广告 位 置 ， 出 价 第 二 高 者 得 到 
第 二 有 价值 的 位 置 ， 以 此 类 推 。 所 以 ， 本 得 到 第 一 个 ， 安 娜 得 到 第 二 
个 ， 查 理 得 到 第 三 个 ， 如 图 4-12 所 示 。 
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图 4-12 图 4-11 示 例 中 客户 广告 位 置 的 广义 二 价 分 配 


每 个 买 家 将 支付 给 谷歌 多 少 费用 ? 根据 广义 二 价 ， 买 方 支付 价款 
等 于 下 一 个 出 价 最 高 者 为 其 广告 位 置 广 付 的 价格 : 


。 本 每 次 点 击 被 收取 20 美 元 (安娜 的 出 价 ) 。 点 击 率 为 每 小 时 
10 次 ， 他 每 小 时 的 支付 金额 为 20 美 元 x10 = 200 美 元 。 

。 安 娜 每 次 点 击 被 收取 10 美 元 (查理 的 出 价 ) ， 点 击 率 为 每 小 
时 5 次 ， 总 额 为 每 小 时 10 美 元 x5 =50 美 元 。 

。 对 于 查理 来 说 ， 没 有 “下 一 个 最 高 ”的 投标 人 。 在 这 种 情况 
下 ， 谷 歌 采取 其 标准 最 低 出 价 。 如 果 是 每 次 点 击 3 美元 ， 那 么 查理 
每 小 时 将 支付 3x1 美 元 =3 美 元 。 


谷歌 将 从 拍卖 中 赚 到 多 少 钱 ? 把 买 家 的 付款 相 加 ， 合 歌 每 小 时 将 
从 招 卖 中 获得 200 美 元 +50 美 元 +3 美 元 =253 美 元 ， 只 要 点 击 率 和 预期 的 
一 样 。 三 个 广告 客户 的 回报 如 何 ? 回顾 前 面 的 内 容 ， 回报 是 估 值 和 文 
付 价 格 之 甜 。 我 们 已 经 计算 了 付款 ， 所 以 只 需要 佑 值 : 


。 本 对 广告 位 置 I 的 估 值 是 他 的 每 次 点 击 收入 (40 美 元) 和 该 位 
置 点 击 率 (10) 相 乘 的 结果 ， 共 计 40 美 元 x10 = 400 美 元 。 所 以 ， 


他 每 小 时 的 回报 是 400 美 元 - 200 美 元 = 200 美 元 。 

。 同 样 ， 安 娜 对 广告 位 置 I 的 估 值 是 20 美 元 x5 = 100 美 元 ， 所 以 
她 每 小 时 的 回报 是 100 美 元 - 50 美 元 = 50 美 元 。 

。 最 后 ， 碍 理 对 广告 位 置 II 的 估 值 为 10 美 元 x1 = 10 美 元 ， 那 么 
他 每 小 时 的 回报 是 10 美 元 - 3 美元 = 7 美元 。 


总 之 ， 每 小 时 的 总 回报 是 200 美 元 +50 美 元 +7 美 元 = 257 美 元 (只 要 


点 击 率 等 于 预期 ) 。 表 4-1 从 买 家 的 角度 总 结 了 结果 。 
表 4-1 基于 购买 者 角度 的 广义 二 价 广告 拍卖 示例 概要 


买 家 收入 广告 估 值 价格 回报 

安娜 20 II 100 50 50 
本 40 I 400 200 200 

查理 10 II 10 3 7 


注 : 收入 单位 为 每 次 点 击 ， 估 值 、 收 费 和 回报 单位 为 每 小 时 


广义 二 价 是 谷歌 用 来 确定 广告 位 置 竞 买 人 排名 的 方法 ， 谷 歌 以 此 
决定 他 们 在 相关 关键 词 设置 下 的 搜索 结果 页 面 如 何 排序 ， 并 实现 利润 
最 大 化 。 然 而 ， 为 了 确定 匹配 ， 广 义 二 价 不 是 唯一 可 以 使 用 的 机 制 。 
其 他 我 们 没有 讨论 的 方法 可 能 会 产生 不 同 的 结果 。 事 实 上 ， 对 于 多 项 
目 拍卖 ， 广 义 二 价 并 不 鼓励 诚实 的 报价 ， 虽 然 它 只 针对 单一 项 目 拍 
卖 。 另 一 种 被 称 为 VCG (Vickrey-Clarke-Groves) 的 方法 在 任何 
情况 下 都 鼓励 诚实 报价 。 但 这 种 方法 也 有 缺点。 因为 对 于 什么 是 “ 正 
确 ” 的 排名 这 一 问题 ， 它 会 有 一 个 以 上 的 答案 。 


应 该 说 明 的 是 ， 在 描述 本 章 不 同类 型 的 担 卖 时 ， 我 们 对 佑 值 的 性 
质 、 每 次 点 击 收入 和 点 击 率 做 了 一 些 简 化 问题 的 假设 。 如 果 你 有 兴趣 
对 其 了 解 更 多 ， 请 参考 本 书 网 站 Q4.3 部 分 。 


我 们 现在 了 解 了 合 歌 如 何 创造 其 大 部 分 收入 。 接 下 来 ， 让 我 们 探 
讨 谷歌 如 何 将 其 标准 页 面 的 结果 排序 ， 以 尽 可 能 提高 搜索 效率 和 质 
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蝇 无 疑问 ， 你 和 几乎 所 有 你 认识 的 人 都 使 用 谷歌 搜索 。 输 入 一 个 
短语 到 搜索 查询 ， 点 击 回 车 ， 可 能 就 会 弹出 数 以 百 万 计 的 相关 链接 。 
很 可 能 你 会 在 最 初 儿 个 结果 中 发 现 你 寻找 的 答案 。 


自 1989 年 互联 网 诞生 以 来 ， 互 联网 上 的 信息 量 就 在 迅速 增长 。 很 
难 估计 今天 到 底 有 多 少 个 网 页 ， 但 目前 统计 可 能 有 60 万 亿 个 (60 000 
000 000 0001) 。 


合 歌 等 搜索 引 敬 如何 记录 所 有 这 些 页 面 呢 ?实际 上 ， 每 个 引擎 都 
有 目 己 的 数据 库 ， 存 储 所 有 它 知 道 的 网 页 信息 。 随 着 网 络 的 迅速 发 展 
和 演变 ， 它 们 如 何 使 其 数据 库 保 持 更 新 ?通过 不 断 抓 取 网 页 ， 使 用 程 
序 目 动 跟 踩 链接 从 一 个 网 页 换 到 下 一 个 ， 并 在 此 过 程 中 添加 新 网 页 到 
数据 库 ， 更 新 现 有 网 页 条 目 。 但 是 没 人 能 保证 这 个 抓 取 过 程 会 到 达 所 
有 页 面 。 


随 着 时 间 的 推移 ， 谷 歌 的 索引 规模 急剧 增长 。 在 图 5-1 中 ， 你 可 以 
看 到 谷歌 的 变化 〈 从 1997 年 到 它 停止 在 首页 宣传 其 数据 库 中 的 网 页 数 
量 ) 。 索 引 规模 在 20 年 内 呈 指 数 上 升 ， 由 1997 年 的 2 400 万 增加 到 2005 
年 的 80 亿 ， 再 到 2015 年 的 60 万 亿 。 


索引 网 页 数量 ( 10 亿 ) 
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编制 
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图 5-1 谷歌 编制 索引 网 页 的 数量 
注 : 从 1997 年 谷歌 成 立 到 2005 年 其 停止 在 主页 上 发 布 该 信息 时 


如 时 谷歌 有 上 万 亿 的 页 面 索引 ， 那 么 当 你 输入 搜索 查询 时 ， 为 什 
么 通常 会 在 最 初 儿 个 结果 中 就 发 现 你 所 需要 的 信息 呢 ? 这 是 我 们 感 兴 
趣 的 问题 。 显 然 ， 页面 不 是 以 谷歌 编制 罕 引 的 顺序 显示 。 事 实 上 ， 搜 
索引 擎 使 用 其 著名 算法 一 一 网 页 级 别 ， 它 通过 解决 巨大 的 方程 组 ， 以 
确定 每 个 网 页 的 重要 性 ， 然 后 按 重 要 性 从 高 到 低 ， 将 相关 查询 结 采 排 
记 


相关 性 与 重要 性 


网 页 排序 的 概念 可 以 追溯 到 20 世 纪 90 年 代 初 期 ， 第 一 代 搜 索引 警 
诞生 时 。 当 然 ， 当 时 的 搜索 引擎 远 不 如 今天 成 熟 。 由 于 存储 和 计算 能 
力 的 限制 ， 它 们 的 数据 库 相 当 小 ， 只 能 存储 页 面 的 子 集 ， 如 标题 和 不 
同 部 分 的 小 标题 。 这 样 ， 搜 索 才 可 以 快速 和 低 成 本 地 进行 。 


这 种 部 分 抽取 的 影响 是 什么 ? 是 信息 和 搜索 精度 的 巨大 损失 。 例 
如 ， 假 设 本 书 第 二 部 分 征 互 联网 上 的 一 个 网 页 。 当 为 它 建立 一 个 数据 


库 条 目 时 ， 第 一 代 搜 索引 擎 很 可 能 只 通过 存储 标题 (例如 “排序 很 
难 ”“ 公 开拍 卖 * 排 列 搜索 结果 ”“ 相 关 性 与 重要 性 ”) 来 表示 。 然 后 ， 将 
用 户 搜索 查询 中 的 文字 与 该 数据 库 条 目 中 的 文字 进行 比较 ， 以 查看 是 
人 否 有 匹配 项 。 因 此 ， 如 采用 户 搜索 “拍卖 ”， 它 会 在 第 二 部 分 找到 一 个 
匹配 项 。 但 如 果 碍 询 “ 搜 索引 擎 ”， 则 不 会 发 现 匹 配 项 ， 即 使 这 征 我 们 
讨论 的 重要 部 分 。 


技术 进步 很 快 使 全 文 搜索 (full text search) 成 为 可 能 。 通 过 
全 文 搜 索 ， 网 页 内 容 的 每 个 字 都 存储 在 数据 库 中 ， 人 允许 搜索 查询 与 所 
有 内 容 匹 配 。1994 年 ， 网 络 仆 虫 成 为 第 一 个 提供 这 一 功能 的 知名 搜索 
引 警 ， 它 于 一 年 后 被 美国 在 线 收购 。 


按 相关 性 排序 


如 条 你 设计 一 个 搜索 引擎 ， 会 如 何 给 网 页 排序 ? 也 许 ， 对 于 用 户 
输入 的 特定 搜索 查询 ， 你 会 按照 页 面 出 现 查询 文字 的 次 数 来 排列 。 毕 
竟 ， 碍 询 文 字 出 现 的 次 数 越 多 ， 台 表明 匹配 度 越 高 。 你 可 以 在 图 5-2 中 
看 到 一 个 非常 小 的 例子 : 当 用 户 搜索 “香草 ”时 ， 每 个 页 面 都 会 检查 这 
个 词 出 现 的 次 数 。 四 个 标 有 A~D 的 网 页 包含 这 个 词 ， 出 现 次 数 分 别 是 
1、5、9 和 2。 搜 索 结 采 页 面 将 这 四 个 页 面 的 链接 排序 为 C、B、D、A 

(每 个 页 面 用 一 些 文字 进行 简短 描述 ) 。 


搜索 : 香草 


数据 库 搜索 结果 


链接 至 C 
来 自 C 的 部 分 文本 
链接 至 B 
来 日 B 的 部 分 文本 


链接 至 DD 
来 自 D 的 部 分 文本 
链接 至 A 
来 日 A 的 部 分 文本 


图 5-2 基于 相关 性 的 搜索 结果 排序 的 简单 示例 


这 种 计算 出 现 次 数 的 方法 是 衡量 网 页 和 查询 相关 度 ( 即 两 者 关联 
度 大 小 ) 的 方式 之 一 。 基 于 相关 性 的 排名 是 早期 搜索 引擎 采取 的 方 
法 ， 也 是 搜索 结果 排序 的 依据 。 换 句 话 说， 它们 将 相关 度 较 高 的 页 面 
显示 在 相关 度 较 低 的 页 面前 ， 以 将 最 有 用 的 结果 放 在 前 面 。 


在 组 合 中 增加 重要 性 


仅仅 根据 相关 性 来 排序 是 搜索 引 警 的 最 好 选择 吗 ? 如 果 我 们 考虑 
谷歌 搜索 在 过 去 20 年 中 取得 的 广泛 成 功 ， 答 案 将 是否 定 的 。 


谷歌 于 1997 年 进入 搜索 引擎 领域 。 当 时 ， 它 的 两 个 创始 人 谢 尔 兽 ， 
布 林 和 拉 里 - 佩 奇 提出 了 网 页 排序 的 新 方法 。 对 他 们 来 说 ， 搜 索引 擎 是 
有 效 完 成 这 一 艰巨 任务 的 最 佳 方式 ， 能 考虑 到 每 个 网 页 的 两 个 不 同 因 
素 : 


。 相 关 性 得 分 (relevance score) ， 根 据 相关 性 概念 ， 确 定 
网 页 内 容 和 指定 搜索 查询 的 相关 性 ; 

。 重 要 性 得 分 (importance score) ， 衡 量 网 页 重要 性 ， 不 
考虑 页 面 内 容 和 搜索 文字 。 


相关 性 得 分 的 计算 确实 使 谷歌 的 远见 与 众 不 同 ， 至 少 在 一 定 程 度 

上 上 如此。 特别 是 ， 谷 歌 开 始 考 虑 某 些 因素 ， 如 字母 大 写 、 字 体 和 内 容 

位 置 ， 这 是 当时 其 他 搜索 引擎 没 有 做 的 。 但 使 网 页 级 别 

(PageRank) (谷歌 的 排名 算法 ， 此 次 命名 利用 了 拉 里 . 佩 奇 名 字 的 

巧妙 双关 ) 比 以 前 的 方法 更 为 成 功 的 是 重要 性 的 概念 。 自 20 世 纪 90 年 

代 末 以 来 ， 它 一 直 是 使 谷歌 成 名 的 驱动 力 。 截 至 2015 年 ， 合 歌 占 据 了 
整个 搜索 引擎 市 场 的 近 2/3 的 “江山 ”， 如 图 5-3 所 示 。 


搜索 引擎 ”美国 在 线 
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图 5-3 2015 年 3 月 ， 美 国 最 受 欢 迎 的 五 个 搜索 引擎 的 市 场 占有 率 

注 ， 虽 然 必 应 (Bing) 在 过 去 几 年 里 一 直 在 稳步 增加 其 份额 ， 但 谷歌 搜索 仍然 占据 了 2/3 的 市 
场 份额 ， 这 个 数字 是 必 应 目前 份额 的 三 倍 多 

在 本 章 的 其 余部 分 ， 我 们 将 看 到 重要 性 得 分 是 如 何 确定 的 ， 包 括 
了 解 由 超 链 接 导 向 形成 的 页 面 网 络 将 网 页 彼此 连接 形成 网 络 。 请 记 
住 ， 与 相关 性 评分 不 同 ， 每 个 页 面 的 重要 性 不 会 随 用 户 输入 的 搜索 查 
询 而 改变 ， 也 不 取决 于 页 面包 含 的 内 容 。 相 反 ， 它 完全 基于 一 张 展示 
网 页 如 何 连接 的 结构 图 。 


图 和 网 络 图 


网 页 通过 超 链接 (hyperlinks) ”( 即 网 页 中 用 户 可 以 跟踪 了 解 
的 外 部 数据 引用 ) 连接 到 另 一 个 网 页 。 在 文本 中 嵌入 超 链接 是 创造 万 


维 网 不 可 或 忠 的 ， 因 为 超 链接 是 网 页 互相 引用 的 手段 。 也 整 是 说 ， 如 
果 一 个 页 面 有 直接 的 超 链接 ， 它 束 会 将 用 户 市 到 男 一 个 页 面 。 


网 页 之 间 的 连接 可 以 简洁 地 用 图 (graph) 表示 。 (使 网 络 运行 
的 互联 网 也 可 以 被 描述 为 一 张 图 ， 我 们 之 后 会 看 到 。) 我 们 可 以 花 一 
整 本 书 来 介绍 图 论 的 数学 理论 ， 但 简单 的 术语 在 这 里 就 足够 了 :图 包 
含 一 组 节点 (nodes) (或 项 点) ， 它 们 由 链接 (links) (或 边 ) 
相互 联系 。 在 本 章 中 ， 我 们 将 节点 视 为 网 页 ， 将 链接 作为 页 面 是 否 互 
相 引 用 的 指标 。 我 们 建立 的 结果 称 为 网 络 图 (webgraph) 。 网 络 图 
是 有 向 (directed) 的 ， 表示 其 链接 不 对 称 ， 页 面 A 引 用 页 面 B 并 不 
代表 页 面 B 会 引用 页 面 A。 


顺便 说 一 句 ， 我 们 将 在 本 书 中 看 到 许多 不 同类 型 的 图 。 它 们 的 区 

别 在 于 构成 节点 的 元 素 和 节点 之 间 的 联系 具体 代表 的 对 象 。 除 了 在 这 

里 看 到 的 网 页 图 ， 我 们 将 讨论 其 他 图 ， 例 如 第 12 章 的 互联 网 路 由 紫 图 

(其 中 的 连接 是 实际 连接 ) 和 第 8、10、14 章 的 人 类 连接 图 (其 中 的 连 
接 是 社会 联系 ) 。 


网 络 图 对 于 理解 重要 性 得 分 很 有 必要 ， 因 为 它们 概括 了 网 络 的 连 
接 性 。 后 面 ， 我 们 将 使 用 图 5-4 中 的 (非常 小 的 图表 来 演示 计算 重要 
性 分 数 的 关键 步 又。 在 这 张 网 络 图 中 ， 有 4 个 页 面 《W、X、Y 和 Z) 和 
8 个 超 链接 。 我 们 假设 所 有 这 些 页 面 都 与 用 户 输入 的 搜索 查询 有 关 ， 
此 它们 都 将 在 结果 页 上 显示 ， 问 题 在 于 显示 在 何 处 。 


另 一 方面 ， 你 会 发 现 我 们 在 本 书 中 坚持 使 用 小 图 表 ， 它 们 可 以 显 
示 在 一 页 上 ， 既 容易 理解 又 能 说 明 要 点 。 不 过 ， 让 我 们 设想 整个 网 络 
的 结构 是 什么 样子 的 。 我 们 可 以 肯定 地 说 ， 在 这 些 数 以 万 亿 计 的 节点 
之 间 ， 这 张 图 看 起 来 极其 稀疏 (sparse) ， 这 意味 着 大 多 数 网 页 只 
连接 到 网 络 中 其 他 网 页 中 的 一 小 部 分 。 即 使 是 维基 百科 的 一 张 有 几 百 


个 链接 的 大 页 面 (这 比 普 通 网 页 要 多 得 多 ) ， 也 仅仅 连接 到 数 万 亿 节 
点 中 的 一 小 部 分 。 


网 页 级 别 不 做 什么 
那么 ， 是 什么 让 一 张 页 面 变 得 “重要 ”? 也 许 是 指向 它 的 页 面 数 


量 ? 这 被 称 为 网 页 的 入 度 (in-degree) ， 它 可 以 衡量 节点 有 多 少 导 
入 链接 (incoming links) : 


。 从 图 5-4 中 ， 你 可 以 看 到 页 面 Y 有 来 自 页 面 VW、X 和 Z 的 导入 
链接 ， 使 其 入 度 为 3。 

。 相 比 之 下 ， 页 面 X 的 入 度 为 2， 有 来 自 wW 和 Z 的 导入 链接 。 

*。 页 面 Z 的 入 度 也 是 2， 有 来 自 X 和 Y 的 导入 链接 。 

。 最后， 页 面 wW 的 入 度 为 1， 有 来 自 Z 的 导入 链接 。 


图 5-4 一 张 小 网 络 图 示例 


注 : 图 中 包括 4 个 页 面 (市 点 ) 和 8 个 链接 。 该 图 是 有 向 的 ， 因 为 链接 不 对 称 : 例如， 页 面 W 
指向 页 面 X， 反 之 则 不 然 


根据 这 一 衡量 重要 性 的 手段 ， 谷 歌 将 按照 Y、X、Z、W (X 和 Z 可 
互 换 ) 的 顺序 返回 结果 。 但 这 是 否 说 明了 所 有 情况 ? 根据 谷歌 的 网 页 
级 别 算法 ， 答 案 是 否定 的 。 我 们 现在 看 看 。 


随机 上 网 着 


谷歌 通过 一 个 人 随机 上 网 的 比喻 解释 了 网 页 级 别 的 概念 。 该 上 网 
者 进入 一 个 网 页 ， 并 不 断 随机 点 击 链接 。 在 这 个 过 程 中 ， 他 最 终 可 能 


会 感到 无 聊 ， 并 在 浏 宽 器 中 输入 男 一 个 地 址 。 你 可 以 在 图 5-5 中 看 到 这 
个 概念 : 此 人 利用 超 链 接 从 A 到 D， 再 到 下 ， 然 后 随机 在 浏览 器 中 输入 
F， 以 此 类 推 。 根 据 网 页 级 别 ， 某 个 页 面 在 这 一 过 程 中 的 访问 率 (相对 
于 访问 所 有 页 面 的 总 次 数 ) 是 该 网 页 的 重要 性 。 
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图 5-5 随机 上 网 者 原理 

注 : 一 个 人 开始 在 页 面 A， 随 机 点 击 一 个 超 链 接 ， 选 择 D。 他 从 D 再 次 选择 一 个 引用 链接 ， 来 
到 E。 转 到 E 后 ， 此 人 决定 在 浏览 器 中 输入 一 个 随机 地 址 ， 转 到 F。 在 F， 作 也 点 击 一 个 链接 到 
G， 该 过 程 继续 

我 们 将 逐步 分 解 随机 上 网 过 程 。 假 设 用 户 利 用 超 链接 ， 从 中 随机 
抽取 。 从 一 个 给 定 的 页 面 ， 随 着 网 页 的 出 度 (out-degree) 增 大 ， 
他 选择 一 个 特定 超 链接 的 概率 会 相应 减 小 。 出 度 是 节点 的 导出 链接 
(outgoing links) 数 ， 而 入 度 是 导入 链接 的 数量 。 


回 到 图 5-4。 比 如 页 面 W 的 出 度 是 2。 页 面 wW 的 随机 上 网 者 有 5096 
的 概率 会 转 到 页 面 X， 也 有 509% 的 概率 会 选择 页 面 Y。 他 不 能 直接 去 页 
面 2， 因 为 没有 这 个 链接 。 


那么 ， 用 户 一 开始 在 某 个 网 页 的 概率 是 多 少 昵 ? 正如 我 们 之 前 提 
到 的 ， 这 肯定 取决 于 该 页 面 的 入 度 。 但 这 还 取决 于 其 他 因素 : 指 癌 该 
页 面 的 链接 的 重要 性 。 例 如 ， 尽 管 Z 只 有 两 个 导入 链接 ， 其 中 一 个 来 


自 Y (这 在 入 度 上 是 最 重要 的 ) 。 如 果 Y 很 可 能 被 访问 ， 那 么 Z 被 访问 
的 可 能 性 至 少 一样 大 ， 因 为 一 旦 来 到 Y， 上 网 者 唯一 的 选择 就 是 点 击 
页 面 Z 1 


从 图 中 量化 重要 性 


我 们 可 以 通过 网 络 图 中 的 节点 和 链接 ， 直 观 地 体现 入 度 、 出 度 和 
网 页 重要 性 的 概念 。 每 个 市 点 都 将 被 赋予 一 个 重要 性 得 分 ， 我 们 分 别 
用 小 写字 和 母 vw、x、y 和 z 代 表 页 面 W 到 Zz 的 得 分 ， 如 图 5-6 所 示 。 我 们 可 
以 把 一 个 页 面 的 重要 性 等 同 于 它 在 随机 上 网 过 程 中 被 选择 的 机 会 。 
个 链接 有 一 个 起 始 下 点 和 一 个 端 节 点 ， 可 以 显示 随机 上 网 者 从 来 源 网 
页 氮 击 ， 进 入 目标 网 页 的 概率 。 换 句 话 说， 页 面 通过 导出 超 链接 “ 传 
播 ”其 重要 性 。 


例如 ， 看 页 面 X。 如 采 上 网 着 在 页 面 Z2 或 W， 而 且 都 可 能 会 选择 
又 ， 那 么 我 们 可 以 把 它 分 为 两 部 分 : 从 W 转 到 X 的 概率 以 及 从 Z 转 到 X 
的 概率 。 


首先 ， 从 W 转 到 X 的 概率 是 多 少 ? 这 要 求 (1) 在 WwW 时 转 到 X; 
(2) 一 开始 位 于 Wi: 


图 5-6 


注 : XX 的 重要 怕 
z/3 


评分 x 取 决 于 W 和 2Z。 由 于 W 和 Z 的 入 度 为 2 和 3， 


因此 这 些 链接 的 权重 为 w /2 和 


。 对 于 (1) ， 我 们 之 前 说 过 ， 从 W 转 到 页 面 X 的 概率 是 50%， 


或 1/2 。 


。 对 于 (2) 


， 这 束 是 w 的 重要 性 ， 也 束 是 w。 


因为 这 些 事件 必须 同时 发 生 ， 所 以 我 们 将 其 概率 相 乘 (类 似 于 第 2 
章 讨 论 Wi-Fi 协 议 时 ， 将 不 发 送信 号 的 概率 相 乘 ) 。 结 果 是 wx1/2 


=W/2° 
其 次 ， 从 Z 转 到 X 的 概率 是 多 少 ? 我 们 可 以 运用 同样 的 逻辑 :这 要 
求 (1) 从 Zz 转 到 X;” (2) 一 开始 位 于 Z: 


。 对 于 (1) ,XX 是 三 种 可 能 性 之 一 ， 所 以 概率 是 1/3， 或 
33.33% 。 


“对 于 (2) ， 概 率 就 是 z。 


两 者 相 乘 ， 就 是 zx1/13 =z/3。 


既然 我 们 可 以 从 W 或 Z 到 达 X， 那 么 把 这 些 概 率 相 加 ，X 的 重要 性 
得 分 表达 为 : x=w/2+z/3。 


页 面 Y 怎 么 样 ? 它 可 以 从 图 中 任何 其 他 页 面 选 择 ， 因 为 它们 都 指 
向 那里 。 从 WwW 有 50% 的 概率 选择 Y， 从 X 也 有 50% 的 概率 ， 从 Z 有 
33.33% 的 概率 。 所 以 ，y = w/2+x/2+z/3， 如 图 5-7 所 示 。 


注 : 页 


图 5-7 


Y 的 重要 性 评分 取决 于 W、X 和 Z。 由 于 W 和 X 的 出 度 均 为 2， 它 们 与 Y 的 链接 权重 为 w 
/2 和 x/2。 因 为 Z 的 出 度 为 3， 该 链接 权重 为 z /3 


运用 这 一 逻辑 ， 对 图 5-4 中 的 四 个 网 页 ， 我 们 得 出 以 下 方程 ， 来 表 


示 重 要 性 得 分 之 间 的 天 系 : 
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你 可 以 看 到 ， 一 个 网 页 的 重要 性 评分 取决 于 其 他 网 页 的 得 分 ， 而 
其 他 网 页 的 重要 性 得 分 又 取决 于 源 网 页 的 得 分 。 这 种 看 似 循 环 的 逻辑 
需要 我 们 解 开 一 个 方程 组 。 按 照 图 5-6 和 图 5-7 中 的 程序 ， 网 络 图 是 直 
观 显示 方程 的 简单 方法 : 


1. 用 源 节 点 的 重要 性 除 以 其 出 度 ， 并 标注 每 个 链接 。 
2. 对 于 每 个 节点 ， 其 重要 性 得 分 等 于 所 有 导入 链接 值 的 总 和 。 


最 后 ， 方 程 的 数量 就 古 图 中 的 节点 数 量 。 
解决 方案 


回 到 前 面 的 方程 组 ， 我 们 现在 有 四 个 方程 和 四 个 未 知 数 (w、x、y 
和 z) 。 有 一 组 重要 性 分 数 能 满足 所 有 方程 吗 ? 总 的 来 说 ， 有 很 多 方法 
能 解 开 这 样 的 方程 组 。 对 于 非常 大 的 网 络 图 ， 同 时 有 许多 变量 (例如 
谷歌 的 60 万 亿 索 引 ) ， 工 程 师 们 已 经 找 出 成 熟 的 方法 ， 能 快速 高 效 地 


找到 答案 。 


如 条 你 对 如 何 仅仅 利用 基本 的 代数 运算 ， 笔 算 解 开 这 个 方程 组 感 
兴趣 ， 请 参考 本 书 网 站 Q5.1 部 分 。 我 们 可 以 很 容易 地 验证 以 下 答案 的 
正面 性 : 


4 
w= Oo— = 0.129 
31 
6 
X=— = 0.194 
31 
9 
y= 一 =0.290 
31 
12 
Zz= = 0.387 
31 


我 们 怎么 能 知道 呢 ? 只 需 将 这 些 值 放 回 方程 中 ， 确 保 其 都 能 成 立 
即 可 。 例 如 ， 第 三 个 方程 y=w /2+x/2+z/3。 这 是 否 成 立 ? 是 的 : 


右边 相 加 为 2/31 + 3/31 + 4/31=9/31， 就 是 y。 你 能 以 同样 的 方式 计算 其 
他 三 个 方程 。 


我 们 也 可 以 通过 补充 网 络 图 的 不 同 组 成 部 分 ， 直 观 地 体现 解决 方 
案 。 你 可 以 在 图 5-8 中 看 到 。 对 于 每 个 网 页 ， 以 下 三 点 是 相等 的 : 页 面 
的 重要 性 得 分 、 导 入 重要 性 之 和 ， 以 及 导出 重要 性 之 和 。 例 如 ， 在 页 
面 Z，12/31 = 9/31+ 3/31= 4/31+4/31+4/31。 在 页 面 X，6/31 = 2/31 + 
4/31 = 3/31+ 3/31° 


Ww 7 世相 


图 5-8 网 络 图 示例 的 重要 性 评分 和 链接 权重 


注 : 你 可 以 看 到 ， 每 个 网 页 的 重要 性 等 于 其 导入 和 导出 重要 性 评分 的 总 和 


那么 ， 基 于 这 些 重要 性 分 数 的 页 面 排序 是 什么 呢 ? 按 重 要 性 从 高 
到 低 排列 的 顺序 依次 为 2、Y、X、W。 如 果 仅 根据 本 章 前 面 的 入 度 方 
法 ， 排 名 则 是 Y、X、Z、W。 基 于 网 页 级 别 ，Y 不 再 是 最 重要 的 ，Z 则 
成 为 最 重要 的 网 页 。 即 使 页 面 Y 有 最 多 的 导入 链接 ， 网 页 级 别 也 会 考 
虑 到 这 些 链 接 的 “等 级 ”: 特别 是 Y 的 两 个 导入 链接 来 自 次 要 节点 W 和 
X， 其 中 只 有 一 半 的 重要 性 被 传播 到 Y， 虽 然 另 一 个 链接 来 自 Z， 但 这 
只 会 带 来 3 Z 的 重要 性 。 


此 外 ， 页 面 Z 可 能 只 有 两 个 导入 链接 ， 但 其 中 一 个 带 来 Y 的 全 部 重 
要 性 ， 因 为 Y 没 有 指 癌 其 他 和 节点 。 由 于 Z 也 获得 X 的 重要 性 ， 因 此 它 目 
然 高 于 Y。 参 考 随 机 上 网 者 概念 ， 这 古 有 道理 的 ， 因 为 当 上 网 者 来 到 
Y， 接 下 来 将 去 Z， 反 之 则 不 然 。 随 着 时 间 的 推移 ，Z 将 获得 比 Y 更 多 
的 访问 ， 因 此 其 重要 性 排名 应 更 高 。 


在 表 5-1 中 ， 你 可 以 看 到 每 个 方法 的 重要 性 分 数 和 排名 概要 。 以 使 
结果 标准 化 ， 这 里 的 入 度 重要 性 是 通过 用 每 个 页 面 的 入 度 除 以 所 有 方 
点 的 入 度 总 和 “(8) 得 出 。 因 此 ， 页 面 W、X、Y 和 Z 的 入 度 为 1、2、3 
和 2， 我 们 得 到 1/8 = 0.125，2/8 = 0.25，3/8 = 0.375，2/8 = 0.25。 

表 5-1 图 5_4 中 网 络 图 的 重要 性 分 数 和 排名 计算 


网 页 级 别 


注 ， 网 页 级 别 能 影响 网 络 图 的 连接 性 ， 而 入 度 则 不 能 


排名 是 否 可 靠 ? 


我 们 看 到 的 是 一 种 方法 ， 它 能 让 我 们 找到 一 组 在 各 种 方程 之 间 均 
取得 一 致 的 得 分 ， 从 而 实现 排名 。 然 而 ， 对 于 任何 网 络 图 ， 我 们 总 是 
能 保证 形成 唯一 的 排名 吗 ? 


答案 是 : 还 不 能 。 总 的 来 说， 我 们 必须 对 程序 做 出 两 个 修改 ， 以 
保证 得 到 唯一 的 解决 方案 。 这 包括 : 网络 图 中 有 基 挂 节点 
(dangling nodes) ， 即 不 指向 任何 其 他 节点 的 节点 ， 网 络 图 中 有 多 
个 连通 分 支 (connected components) 。 有 关 这 些 特殊 情况 以 及 
网 页 级 别 如 何 应 对 的 更 多 信息 ， 你 可 以 参考 本 书 网 站 Q5.2 和 Q5.3 部 
分 。 可 以 说 ， 这 些 修改 涉及 对 部 分 随机 上 网 过 程 做 出 的 说 明 ， 对 此 我 
们 没有 详细 描述 。 如 果 我 们 将 这 些 修正 应 用 于 程序 中 ， 那 么 网 页 级 别 
将 始终 是 唯一 的 答案 。 


要 使 网 页 级 别 计算 的 具体 程序 用 于 数 以 万 亿 计 的 网 页 ， 需 要 一 些 
超出 我 们 范围 的 高 等 数学 知识 。 但 你 现在 能 从 概念 上 理解 谷歌 如 何在 
搜索 结 末 页 将 网 页 排序 。 虽 然 我 们 的 重点 几乎 一 直 是 如 何 得 出 重要 性 
分 数 ， 但 请 记 住 相关 性 得 分 也 是 搜索 引擎 原理 的 重要 因素 ， 可 以 使 无 
关 的 页 面 ( 即 没 有 匹配 用 户 查 询 内 容 的 页 面 ) 在 一 开始 束 被 过 滤 掉 。 


钞 一 闻 
种 二 部 分 
> 二 
总 结 


一 人 


在 本 书 第 二 部 分 ， 我 们 探讨 了 排序 的 方法 ， 这 有 是 谷歌 运行 的 基 
础 。 我 们 研究 了 两 种 使 公司 沛 选 有 关 部 标 或 网 页 特定 项 目的 关键 案 
例 ， 以 实现 对 项 目的 有 效 排序 。 图 II-1 概 括 了 两 种 情况 ， 在 拍卖 中 ， 
关键 词 广告 采用 广义 二 价 拍卖 ， 以 确定 如 何 最 好 地 匹配 买 家 和 广告 
位 置 ， 而 通过 网 页 级 别 ， 人 谷歌 从 极其 巨大 的 网 页 中 获得 重要 性 (及 


相关 性 ) 评分 ， 以 确定 在 搜索 结果 中 什么 位 置 显 示 什 么 页 面 。 


除了 搜索 引擎 、 广 告 位 置 和 谷歌 ， 排 序 还 出 现在 许多 网 络 环境 
中 。 因 此 ， 排 序 成 为 网 络 生活 的 一 个 困难 但 必要 的 部 分 ， 也 就 不 足 
为 奇 了 。 排 名 原则 将 再 次 出 现在 第 6 革 和 第 10 划 ， 分 别 关 于 产品 列表 
和 社会 网 络 中 的 人 际 图 。 


图 II-1 本 书 此 部 分 两 个 不 同 排序 案例 研究 的 总 结 


与 埃 里 克 : 施 密 特 的 对 话 


埃 里 克 - 施 密 特 是 Alphabet 公 司 (谷歌 的 母 公司 ) 的 执行 主席 。 
2001 年 到 2011 年 间 ， 他 曾 担任 谷歌 首席 执行 官 。 


作者 : 让 我 先 问 你 这 个 问题 。 你 能 想象 没有 谷歌 的 世界 吗 ? 它 看 
起 来 是 什么 样 的 ? 


埃 里 克 : 我 记得 在 没有 谷歌 时 ， 知 识 主 要 是 逸事 或 书本 知识 。 当 
时 的 情况 是 : 由 于 你 看 电视 和 读 报纸 ， 所 以 会 对 事物 有 大 体 的 了 解 。 
人 们 会 来 告诉 你 一 些 事情 ， 但 你 没有 办 法 进行 核实 。 现 在 我 们 正 进行 
核实 。 人 们 总 是 对 我 说 一 些 可 能 不 真实 的 事情 ， 我 用 谷歌 来 检查 ， 这 
就 是 谷歌 本 身 的 工作 原理 。 如 果 你 正在 用 谷歌 ， 有 人 声称 诸如 “你 知道 
吗 ， 月 亮 最 近 被 证 明 是 扁平 的 ”， 你 会 将 这 句 话 输入 ， 并 知道 事实 并 非 
如 此 。 所 以 ， 一 旦 你 形成 了 这 样 的 生活 方式 ， 每 当 有 人 说 了 什么 ， 就 
去 检查 吧 。 这 种 “信任 但 验证 ”的 模式 是 一 种 不 错 的 生活 方式 。 


作者 : 你 认为 这 取决 于 对 大 众 智慧 的 基本 假设 吗 ? 因 为 谷歌 得 到 
大 家 公开 披露 的 信息 ， 所 以 所 有 人 在 同一 时 间 犯 错 的 概率 是 非常 小 
的 ， 对 么 ? 


埃 里 殉 : 人 们 对 谷歌 的 评价 是 ， 一 般 说 来 ， 它 的 算法 足够 准确 ， 
最 终 能 让 大 多 数 人 相信 的 事实 排名 最 高 。 因 此， 以 “世界 是 平 的 ”这 句 
话 为 例 ， 如 果 你 输入 “世界 是 平 的 ”， 作 为 一 本 书 的 标题 ， 它 在 这 个 意 
义 上 是 对 的 。 所 以 ， 如 采 我 们 谈论 的 是 《 世 界 是 平 的 》 这 本 书 ， 那 么 
这 是 一 个 真实 的 表述 ， 否 则 就 十 假 的 。 我 发 现 一 般 情况 下 ， 合 歌 的 最 
高 排名 结果 都 相当 准确 ， 因 为 大 多 数 人 部 相信 和 事实。 而 你 最 多 能 做 
的 ， 束 是 当 有 人 告诉 你 某 件 事 时 ， 比 如 “你 知道 国会 里 的 人 有 90% 是 罪 


犯 吗 ”， 你 把 它 输入 进去 ， 出 来 的 第 一 个 结果 是 Snopes 〈 一 个 力争 揭 罕 
常见 谣言 的 网 站 ) ， 你 会 看 到 它 实际 上 不 是 真 的 。 


作者 : 除了 信息 收集 和 展示 方面 ， 你 能 想象 今天 生活 的 其 他 部 分 
没有 谷歌 吗 ? 


埃 里 克 : 我 们 希望 我 们 做 的 事情 和 使 用 牙刷 刷牙 一 样 规律 和 平 
常 。 你 对 于 使 用 的 牙刷 不 会 想 太 多 ， 只 是 去 使 用 。 因 此 使 用 谷歌 邮箱 
和 合 歌 浏 哎 絮 ， 把 你 的 信息 储存 在 “ 云 " 中 ， 这 古 我 们 的 愿望 。 当 然 ， 
我 使 用 所 有 这 些 工 具 ， 我 把 一 切 部 存在 云端 。 现在 我 最 喜欢 举 的 例子 
征 照 片 。 像 大 多 数 人 一 样 ， 我 有 很 多 照片 储存 在 不 同 的 地 方 。 有 了 谷 
歌 相册 ， 我 现在 基本 上 可 以 把 它们 上 传 到 谷歌 邮箱 账户 ， 谷 歌 相册 还 
会 进行 整理 ， 并 删除 重复 数据 ， 你 还 可 以 搜索 图 片 中 的 内 容 。 它 使 用 
机 器 学 习 和 机 器 视觉 来 查看 图 片 。 


作者 : 说 到 机 器 学 习 和 大 数据 ， 你 认为 未 来 网 络 在 推荐 方面 ， 比 
如 推荐 观看 什么 视频 内 容 ， 推 荐 朋友 ， 推 荐 今天 做 什么 等 ， 将 变 得 多 
么 个 性 化 ? 让 机 器 稼 能 比 我 们 目 己 更 了 解 我 们 ， 这 一 天 距离 我 们 还 有 
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埃 里 克 : 我 认为 这 里 有 两 个 不 同 的 问题 。 我 们 距离 为 人 们 提供 非 
常 好 的 建议 有 多 远 ? 答案 是 非常 接近 。 原 因 是 ， 人 们 倾向 于 遵循 类 似 
的 模式 ， 他 们 的 朋友 往往 是 相似 的 。 我 们 总 是 说 ， 每 个 人 都 是 不 同 
的 。 你 有 不 同 的 朋友 ， 但 事实 上 ， 你 的 朋友 往往 有 相同 的 文化 观 ， 显 
然 还 说 同一 种 语言 ， 并 且 年 龄 相仿 ， 有 相同 的 生活 经 历 ， 所 以 你 的 朋 
友 往 往 能 很 好 地 预测 你 喜欢 什么 类 型 的 东西 。 这 个 概率 不 是 100%， 但 
是 相当 高 。 所 以 当 我 们 运用 大 数据 寻找 建议 时 ， 例 如 在 视频 网 站 
YouTube 上 ， 往 往 会 获得 很 好 的 推荐 。 


现在 重要 的 是 ， 要 知道 人 们 可 能 会 从 隐私 的 角度 来 看 这 个 问题 ， 
但 假设 你 已 经 选择 获得 这 些 建 议 ， 我 觉得 它们 非常 有 用 。 这 并 不 意味 


着 “软件 ”会 成 为 与 你 交谈 的 某 种 智能 生命 。 这 是 一 个 巨大 的 飞跃 。 我 
认为 ， 我 们 现在 知道 的 是 ， 我 们 明日 计算 机 视觉 比 人 类 视觉 要 好 ， 所 
以 像 谷 歌 相册 之 类 的 东西 运行 得 真 的 很 好 。 至 于 它 还 可 以 走 多 远 ， 我 
认为 这 是 一 个 推测 的 问题 。 每 个 人 都 想 要 一 个 机 器 人 ， 可 以 和 你 说 
话 ， 并 不 断 帮 助 你 。 问 题 是 ， 这 多 久 以 后 会 发 生 ? 我 想 说 ， 我 相信 将 
来 会 有 一 个 相当 不 错 的 私人 工作 助理 说 : “ 挨 里 克 ， 你 需要 打 电 话 给 那 
个 普林斯顿 的 教授 ， 你 像 往 当 一样 迟 到 了 。” 我 认为 那样 的 人 机 互动 是 
很 有 可 能 的 。 我 认为 除 此 之 外 ， 更 多 的 是 猜测 。 


作者 : 你 认为 是 否 可 能 出 现 一 种 趋势 ， 人 们 被 理解 为 以 某 种 方式 
行事 ， 被 提供 要 做 的 事情 以 及 阅读 和 观看 的 内 容 ， 这 种 趋势 越 来 越 多 
是 关 于 “是 什么 ”， 而 不 是 “可 能 是 什么 ”? 换 句 话说 ， 机 絮 寡 能 实际 上 
征 强 化 了 人 们 目前 的 个 性 ， 而 不 是 给 他 们 一 个 机 会 去 芝 试 完全 不 同 的 
东西 并 涉足 新 领域 ? 


埃 里 克 : 在 过 去 的 10 年 里 ， 这 个 问题 以 许多 不 同形 式 被 提出 ， 到 
目前 为 止 还 没有 证 据 表明 这 种 偏见 存在 。 如 有 果 人 们 谈论 的 内 容 让 大 家 
变 得 更 加 狭隘 ， 我 则 认为 大 数据 世界 的 在 线 生 活 和 意味 着 ， 你 接触 到 了 
以 前 没有 接触 的 非常 多 的 东西 。 


让 我 们 回 到 合 歌 之 前 的 生活 。 在 那 种 生活 中 ， 你 去 上 学 ， 有 工 
作 ， 有 家 庭 ， 看 电视 。 这 里 面 没有 很 多 不 同 的 观 氮 。 而 今天 ， 当 你 人 花 
时 间 上 推荐 、 脸 书 ， 使 用 电子 邮件 等 ， 你 能 接触 到 广泛 得 多 的 不 同 说 
法 。 顺 便 阅 一 下 ， 其 中 有 些 是 假 的 ， 然 后 你 用 谷歌 来 揭 罕 它们。 所 以 
我 不 同意 这 种 说 法 ， 我 理解 这 种 说 法 ， 但 没有 证 据 证 明 。 相 反 ， 有 很 
多 证 据 表明 ， 和 信 们 上 网 时 会 接触 到 很 多 新 的 东西 ， 在 许多 情况 下 ， 它 
们 会 题 履 人 们 的 观念 。 但 人 们 不 想 听 ， 也 不 同意 。 


作者 : 的 确 ， 在 YouTube 上 我 能 反复 看 到 推荐 给 我 的 相似 内 容 ， 
也 有 我 从 来 没有 想 过 我 会 看 到 的 全 新 内 容 。 


埃 里 克 : 对 于 产生 我 们 所 说 的 机 缘 巧合 ， 这 些 系统 可 能 会 很 擅 
长 。 你 不 知道 你 可 能 会 对 什么 东西 感 兴趣 ， 但 它 能 发 现 ， 因 为 它 知 道 
一 点 点 你 关注 的 东西 。 正 如 你 所 知道 的 ， 从 技术 上 说 ， 所 有 这 些 东 西 
都 是 经 过 训练 的 大 型 神经 网 络 ， 所 以 它们 不 会 十 分 精确 。 但 是 对 于 一 
般 的 观察 式 知识 和 对 事物 的 一 般 熟 悉 上 ， 它 们 将 是 非常 有 用 的 。 


没有 人 认为 它们 会 一 直 都 是 正确 的 ， 也 没有 人 声称 它们 总 
的 。 我 们 不 说 谷歌 说 的 是 真 话 。 我 们 说 的 是 ， 谷 歌 尽 其 所 能 将 信 
序 ， 以 给 出 这 种 情况 下 的 最 佳 答案 ， 我 们 也 已 经 做 得 很 好 了 。 


作者 : 说 到 人 与 人 之 间 的 交流 ， 我 想 ， 过 去 只 有 电话 ， 然 后 就 有 
了 一 种 叫 电子 邮件 的 东西 。 然 后 还 有 短信 ， 还 有 社交 网 络 ， 还 有 哲 照 
并 发 送 给 其 他 人 ， 然 后 是 微 信 ，WhatsApp， 等 等 。 有 趣 的 是 ， 工 程 师 
们 非常 努力 地 让 我 们 进行 同步 视频 聊天 ， 而 现在 人 们 最 喜欢 的 是 非 同 
步 的 联系 ， 互 相 发 送 文 本 和 语音 信息 。 在 你 心目 中 ， 人 们 互相 交流 的 
理想 方式 是 什么 ? 


埃 里 克 : 你 还 记得 “独自 打 保龄球 ”的 说 法 吗 ? 它 认 为 社会 将 让 人 
变 成 一 个 个 孤立 的 个 体 ， 坐 在 沙发 上 看 电视 ， 而 不 进行 任何 社交 。 这 
种 说 法 唯一 的 问题 是 ， 它 是 完全 错误 的 。 如 果 你 看 看 今天 的 社会 ， 你 
会 发 现 人 们 总 是 在 过 度 交 流 ， 我 认为 这 就 是 技术 的 教训 ， 人 们 总 是 想 
用 各 种 可 能 的 方式 来 交流 ， 你 会 看 到 他 们 交流 的 方式 多 种 多 样 。 我 不 
认为 未 来 只 会 有 一 种 交流 方式 。 举 例 来 说 ， 电 子 邮件 曾经 是 最 好 的 沟 
通 方式 ， 而 不 是 被 理解 为 还 有 不 同 的 形式 。 


我 给 你 举 个 例子 。 微 信 有 非常 好 的 信息 功能 。 你 可 以 运行 程序 ， 
还 可 以 按 下 一 个 按键 ， 给 另 一 个 人 留 下 短语 音信 息 。 这 些 都 是 非常 丰 
富 的 通信 环境 ， 有 是 点 对 点 的 联系 。 所 以 我 认为 你 会 看 到 很 多 不 同 的 通 
信 方 式 。 当 我 和 你 说 话 时 ， 我 在 接收 电子 邮件 、 文 本 信息 和 语音 信 
思 ， 外 面 还 有 人 想 打 断 我 。 这 在 今天 的 世界 是 正常 的 。 我 不 是 说 这 对 


人 类 有 益 ， 但 这 是 事实 。 有 一 个 有 趣 的 统计 说 ， 人 在 一 周 内 会 触摸 1 
500 次 手机 ， 青 少年 平均 每 天 发 送 超过 100 条 文本 信息 。 我 刚 读 了 一 篇 
文章 说 ，WhatsApp 信 息 数 量 比 短 信和 发 送 总 数量 还 要 多 50%。 因此， 通 
信 章 命 的 程度 不 仅 深 刻 ， 而 且 意义 深远 。 这 是 所 有 通信 形式 的 巨大 炬 
发 式 增 长 。 但 你 还 是 会 听 到 有 人 抱怨 这 一 点 。 但 我 们 是 人 类 ， 我 们 所 
做 的 只 是 沟通 。 这 是 我 们 从 原始 人 时 代 束 一 直 在 做 的 事 。 


作者 : 是 。 现 在 通信 也 有 代价 。 过 去 ， 你 按 通话 时 长 付费 ， 并 获 
得 移动 设备 的 无 限 数据 流量 。 现 在 ， 至 少 在 美国 ， 情 总 完 全 相反 。 你 
可 以 使 用 电话 的 通话 功能 ， 通 话 时 长 不 限 ， 但 你 必须 按 不 同等 级 为 移 
动 数据 ， 也 许 是 家 性 定价 计划 付费 。 


挨 里 克 :， 原 来 的 互联 网 并 没有 为 服务 收费 ， 每 当 你 为 某 个 东西 收 
费 ， 束 会 创造 一 种 稀缺 性 。 电 信 运 营 商 为 带 览 收费 ， 因 为 它们 必须 问 
政府 购买 昂贵 的 带宽 ， 而 且 租赁 和 运行 都 很 难 ， 所 以 它们 受到 容量 制 
约 。 政 府 提出 一 个 称 为 共享 频谱 的 新 建议 ， 可 以 通过 共 至 频谱 进行 通 
话 ， 而 不 是 让 单一 运营 商 拥有 一 大 段 频 谱 ， 这 将 在 实质 上 释放 市 充 。 


作者 : 那么 你 是 说 ， 按 不 同 机 会 访问 频谱 ， 而 不 是 静态 分 配 ， 可 
以 优化 频谱 的 使 用 效率 ， 达 到 更 充分 利用 的 程度 从 而 降低 成 本 ? 


埃 里 克 : 对 。 如 果 你 看 看 今天 的 频谱 ， 它 基本 上 一 直 是 空闲 的 。 
对 此 我 们 使 用 的 比喻 是 ， 我 们 的 公路 由 各 家 麦当劳 拥有 ， 要 苹 只 带 你 
到 你 的 那 家 麦当劳 ， 其 他 什么 地 方 都 不 去 ， 这 没有 道理 。 你 应 该 分 
译 。 所 以 从 市 冤 的 角度 来 看 ， 共 至 是 十 分 合理 的 ， 而 且 会 成 为 现实 。 


作者 : 随 着 Nest 智 能 温 控 、 谷 歌 智能 眼镜 等 物 联网 设备 的 崛起 ， 
人 们 看 到 智能 家 居 、 智 能 城市 、 智 能 工厂 正在 出 现 ， 环 顾 四 周 ， 你 发 
现 按钮 可 能 是 电脑 ， 云 可 能 会 像 筋 一 样 下 降 到 我 们 号 边 。 但 人 们 也 担 
心 隐 私 和 安全 问题 ， 尤 其 是 围绕 网 络 边缘 ， 消 费 电子 设备 剧 增 并 联 
网 。 你 怎么 看 行 物 联网 的 安全 问题 ? 


埃 里 克 : 一 般 说 来 ， 我 们 应 该 能 够 确保 这 些 东西 相对 安全 。 运 用 
现代 加 密 和 现代 算法 ， 通 信 应 该 是 高 度 个 人 和 高 度 安全 的 。 这 需要 通 
过 2 048 位 加 密 法 、 椭 圆 曲线 技术 加 密 一 切 静 止 和 传输 中 的 数据 ， 所 以 
你 看 到 的 问题 是 因为 人 们 没有 充分 做 到 这 一 点 ， 他 们 需要 这 样 做 。 


作者 : 那么 ， 如 果 其 中 有 些 设备 没有 足够 强大 的 计算 能 力 或 能 
量 ， 来 运行 最 先进 的 加 密 搁 术 ， 你 会 如 何 建议 ?还 有 其 他 的 解决 办 法 
吗 ? 


埃 里 克 : 我 还 是 不 同意 问题 的 前 提 。 现 在 网 络 的 所 有 算法 都 使 用 
HTTPS， 这 是 基于 SSL 的 HTTP。 人 们 有 很 多 争议 ， 因 为 苹果 手机 是 如 
此 安全 ， 连 政府 都 不 能 拿 来 解锁 ， 我 相信 你 已 经 恋 过 有 关 报 道 。 计 算 
机 速度 足够 快 ， 网 络 速 度 也 足够 快 ， 可 以 不 受 限制 地 满足 你 所 描述 的 
需求 。 当 然 ， 最 终 还 是 存在 局 限 性 ， 但 我 们 还 没有 看 到 。 我 最 喜欢 的 
例子 是 ， 互 联网 的 主要 用 途 是 什么 ? 视频 。 你 怎么 能 想象 可 以 点 对 点 
传输 视频 ? 咽 ， 不 论 如 何 ， 反 正 就 是 做 到 了 。 这 就 是 网 飞 和 YouTube 
所 做 的 ， 它 们 做 得 很 好 ， 令 人 震惊 。 


作者 : 确实 如 此 。 说 到 YouTube， 它 无 疑 已 经 是 并 将 继续 成 为 一 
个 非常 成 功 的 部 署 ， 在 谷歌 所 做 的 一 切 事情 中 还 有 许多 其 他 例子 。 我 
读 了 你 的 书 ， 想 知道 ， 在 你 看 来 谷歌 的 创新 方式 有 什么 特别 之 处 吗 ? 


挨 里 到 : 如 果 你 回 到 核心 公式 ， 你 会 发 现 谷歌 公司 是 由 技术 人 员 
管理 ， 关 注 真 正大 赌注 的 技术 ， 而 且 我 们 还 有 非常 高 的 招聘 要 求 。 笠 
运 的 是 ， 我 们 的 广告 系统 产生 了 大 量 利润 ， 我 们 就 可 以 将 其 投入 到 这 
些 痢 技术 上 。 


作者 : 你 提 到 了 高 标准 的 招聘 要 求 。 你 认为 当前 在 美国 有 足够 
的 “人 才 ” 可 以 雇用 吗 ? 


埃 里 到 : 首先 ， 美 国 的 目标 应 该 是 把 所 有 真正 聪明 的 人 从 其 他 国 
家 吸引 到 类 国 。 不 壮 的 是 ， 我 们 的 政府 有 一 项 非常 思 毒 的 政策 ， 台 是 
H-1 等 证 限制 。 所 以 你 知道 ， 我 们 培养 了 最 好 和 最 聪明 的 人 才 ， 然 后 
把 他 们 踊 出 这 个 国家 。 这 真 的 很 轧 权 。 所 以 我 认为 你 永远 不 会 有 足够 
的 人 来 创造 未 来 。 


作者 : 我 想 再 问 一 个 问题 。 想 想 你 在 谷歌 的 时 候 ， 如 果 你 要 举 出 
一 个 你 做 过 的 最 关键 的 决定 ， 那 会 是 什么 ? 


埃 里 死 ， 那 很 难说 ， 因 为 当 你 管理 一 个 公司 ， 你 只 要 尽量 快速 发 
展 束 可 以 ,但 我 要 说 的 是 ， 我 们 做 过 最 重要 的 事情 是 ， 我 们 建立 了 一 
个 系统 ， 将 创新 系统 化 。 换 句 话 说， 我 们 有 很 多 想法 ， 并 且 不 断 检测 
它们 ， 然 后 选择 那些 行 之 有 效 的 方法 ， 这 样 你 区 可 以 将 创新 系统 化 。 
你 无 法 预测 ， 但 你 可 以 将 它 系 统 化 ， 并 创造 能 扩展 规模 的 产品 。 我 们 
将 创新 与 规模 结合 ， 生 产 快速 成 长 的 伟大 产品 ， 使 你 快速 成 长 。 如 果 
你 想 看 合 歌 以 外 的 例子 ， 那 就 看 优 步 吧 ， 那 是 一 个 相对 简单 的 想法 。 
它 的 内 部 是 复杂 的 ， 但 一 旦 你 做 得 对 ， 它 在 任何 地 方 都 能 用 ， 所 以 它 
们 可 以 迅速 扩展 到 世界 各 地 ， 除 非 被 法 规 或 政府 禁止 。 但 产品 是 有 效 
的 ,一旦 它 在 一 个 地 方 起 作用 ， 你 束 可 以 在 任何 地 方 应 用 它 。 


作者 : 这 让 我 想起 了 福特 将 生产 流水 线 系 统 化 的 事情 。 当 你 说 将 
创新 过 程 系统 化 时 ， 征 如 何 对 创造 性 观念 进行 评 佑 ， 然 后 做 出 放弃 ， 
改进 或 以 后 重 独 评估 的 决定 的 ? 这 如 何 进 行 ? 


埃 里 死 ， 我 们 有 一 个 叫 “20% 时 间 ” 的 做 法 ， 鼓 励 人 们 在 他 们 感 兴 
趣 和 好 奇 的 事情 上 人 花 1/5 的 工作 时 间 ， 许 多 想法 束 来 目 20% 时 间 。 这 征 
好 消息 。 坏 消 轧 是 ， 今 天 做 一 个 产品 需要 100 人 “。 这 些 产品 又 大 又 复 
杂 ， 但 它们 总 是 从 个 人 或 小 团队 的 想法 开始 ， 这 些 想 法 让 他 们 感到 兴 
备 ， 然 后 被 付 诸 实 施 。 因 此 ， 你 市 上 了 解 技术 发 展 的 高 级 技术 人 员 ， 
创造 更 多 这 样 的 开端 ， 你 融会 变 得 更 有 创造 性 。 


作者 : 最 初 的 想法 ， 从 20% 时 间 探 索 到 决定 将 其 变 成 产品 ， 通 常 


需要 多 少 轮 的 审查 和 完善 ? 


埃 里 到: 我 不 认为 有 一 个 单一 规则 。 有 些 东 西 发 展 得 更 快 ， 有 的 
发 展 得 慢 。 但 关键 是 ， 要 不 断 地 回顾 它们 ， 看 它们 是 否 取得 了 进展 。 
有 的 想法 有 用 ， 有 的 没 用 ， 没 关系。 显然 ， 一旦 清楚 它 不 会 有 用 ， 你 
越 快 放弃 它 并 重组 团队 就 越 好 。 


作者 : 我 想 ， 人 们 一 旦 习惯 了 这 个 过 程 ， 就 会 享受 这 个 过 程 吗 ? 


挨 里 克 : 这 很 难 。 人 们 不 希望 自己 的 项 目 失 败 ， 不 喜欢 受到 审 


查 。 这 不 容易 。 


作者 : 到 目前 为 止 ， 它 的 表现 非常 棒 。 埃 里 克 ， 谢 谢 你 分 享 你 的 
想法 。 


第 三 部 分 


大 众 很 聊 明 


零售 购物 、 看 电影 和 上 课 只 是 我 们 受到 互联 网 影响 的 三 种 日 党 
活动 。 因 为 有 亚马逊 等 电子 商务 网 站 、 网 飞 等 内 容 分 发 网 站 ， 以 及 
聚 课 等 在 线 课程 网 站 的 提供 者 ， 我 们 可 以 在 舒适 的 家 中 进行 这 些 活 
动 。 

通过 在 网 上 做 这 些 事情 ， 我 们 会 增加 对 入 们 行为 和 偏好 的 了 
解 。 当 我 们 浏 咒 网 站 时 ， 我 们 的 行为 通常 会 被 存储 ， 在 许多 情况 
下 ， 它 会 被 用 于 改变 那些 随后 访问 网 站 的 人 的 体验 。 例 如 ， 当 你 在 
亚马逊 上 写 下 对 一 件 产 品 的 反馈 ， 它 可 能 会 影响 该 产品 在 亚马逊 的 
页 面 列表 中 出 现 的 排序 。 当 你 在 网 飞 上 给 一 部 电影 打分 ， 它 可 能 会 
影响 到 这 部 电影 是 否 会 被 推荐 给 别人 。 


在 本 书 的 这 一 部 分 ， 我 们 将 探讨 亚马逊 产品 排序 背后 的 理念 
(第 6 章 ) ， 网 飞 如 何 推荐 电影 (第 7 章 ) ， 以 及 人 们 如 何在 莫 课 中 
互相 学 习 (第 8 章 ) 。 这 些 应 用 运作 的 核心 是 “群众 智慧 ”的 概念 ， 意 
思 是 随 着 人 群 数量 增加 〈 即 关于 产品 或 项 目的 更 多 信息 被 收集 ) ， 
人 们 的 集体 决策 会 更 好 ( 即 对 产品 或 项 目 质 量 的 估计 更 准确 ) 。 然 
后 ， 在 第 四 部 分 ， 我 们 将 转 同 群众 不 那么 明智 的 方面 。 


在 这 段 进入 社交 网 络 的 旅程 开始 之 前 ， 我 们 要 提醒 你 ， 对 这 些 
类 型 的 网 络 建 模 总 体 上 杯 手 得 多 ， 模 型 与 现实 之 间 有 巨大 老 距 。 在 
第 三 和 第 四 部 分 ， 我 们 必须 注意 模型 解释 和 预测 能 力 及 其 基本 假设 
的 局 限 性 。 同 时 ， 我 们 必须 对 “平均 ”和 “概率 ”等 术语 的 光 在 滥用 近 
高 敏感 度 。 


第 6 章 
合并 产品 评级 


无 论 息 鞋 、DVD、 教 材 还 是 其 他 商品 ， 越 来 越 多 的 零售 购物 通过 
互联 网 进行 。2014 年 ， 人 们 在 网 上 购物 中 花费 了 总 计 1.3 万 亿美 元 ， 这 
大 约 是 当时 零售 市 场 总 额 的 6%， 并 且 可 能 有 更 大 的 增长 空间 。 到 2018 
年 ， 这 一 文 出 预计 将 翻番 。 面 对 这 么 多 可 供 选 择 的 产品 和 项 目 ， 给 客 
户 提供 有 力 的 “质量 提示， 以 指导 他 们 的 决策 ， 是 网 上 和 零售 取得 成 功 
的 关键 。 


流泪 电子 商务 的 “ 河 ” 


美国 最 大 的 电 商 公司 是 亚马逊 〈 图 6-1) 。 亚 马 还 网 上 书店 由 杰 夫 
' 贝 低 斯 于 1994 年 创立 ， 该 公司 最 初 妃 求 相当 不 寻 冰 的 商业 模式 ， 直 到 
世纪 之 交 才 开始 支 利 。 虽 然 其 最 初 增 长 缓慢 ， 但 在 互联 网 泡沫 破 狸 
后 ， 亚 马 逊 是 少数 几 个 生存 下 来 的 电子 商务 公司 之 一 。 事 实 上 ， 在 此 
后 不 信 ， 该 公司 于 2001 年 第 四 季度 首次 实现 盘 利 。 


QITiQcOfi 
ee 


今天 ， 亚 马 逊 的 收入 每 年 都 在 增加 ， 从 衣服 和 鞋子 到 软件 和 电子 
设备 ， 任 何 产 品 都 可 以 从 其 网 站 上 购买 。 你 甚至 可 能 束 是 从 那里 买 的 


本 书 ! 


亚马逊 的 服务 也 延伸 到 电子 商务 之 外 。2007 年 ， 该 公司 开始 生产 
自己 的 电子 图 书 阅读 器 Kindle (我 们 在 第 3 章 智能 数据 定价 的 讨论 中 提 
到 过 ) 。3 年 后 ， 亚 马 逊 宣布 ，Kindle 的 销量 已 经 超过 其 网 站 的 精装 书 
销量 。 


多 年 来 ， 街 边 的 实体 零售 商 与 顾客 面对面 交易 ， 他 们 和 亚 蕊 撑 等 
网 上 和 零售 商 之 间 有 明显 区 别 。 后 来 ， 许 多 商店 零售 商 进 行 扩张 ,开始 
利用 新 兴 的 电子 商务 行业 。 一 个 典型 的 例子 是 沃尔玛 ， 它 是 最 大 的 实 
体 零 售 商 ， 同 时 一 直 在 网 上 零售 商 中 排名 前 五 。2012 年 ， 亚 马 还 来 目 
在 线 销 售 的 收入 仍 超过 沃尔玛 8 倍 ， 如 图 6-2 所 示 。 同 年 第 二 季度 ， 据 
估计 ， 亚 马 逊 网 站 的 访问 量 达 到 1 人 亿 人 次 ， 超 过 沃尔玛 一 倍 。 
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2012 年 线 上 零售 收入 〈 10 亿美 元 


亚马逊 史 泰 博 苹果 沃尔玛 自由 互动 
图 6-2 五 大 在 线 零售 商 2012 年 线 上 销售 总 收入 


那么 ， 亚 马 逊 为 何如 此 成 功 ? 除了 它 的 许多 功能 (例如 广泛 的 选 
择 ， 某 些 情况 下 的 两 日 免费 运送 ) 和 有 竞争 力 的 价格 ， 使 该 网 站 吸引 
人 的 一 部 分 原因 是 ， 它 有 一 个 让 顾客 提供 反馈 的 机 制 : 通过 产品 评 
论 。 亚 马 逊 将 汇总 对 某 件 产品 的 评价 ， 形 成 一 个 数字 ， 即 平均 星 级 评 
分 ， 使 消费 者 了 解 产品 的 “质量 ”。 在 本 章 ， 我 们 将 探讨 亚 马 进 等 在 线 


零售 商 可 以 使 用 的 汇总 意见 的 方法 ， 并 以 此 确定 显示 给 消费 者 的 产品 
列表 顺序 。 


你 相信 平均 评级 吗 ? 


假设 你 在 亚马逊 选 购 一 台新 的 高 清 电 视 。 在 浏览 搜索 结果 列表 
后 ， 你 最 终 根 据 价 格 将 搜索 范围 缩小 到 两 个 ， 如 图 6-3 所 示 。 


东芝 32C120U 32 英寸 720p 60Hz 液晶 高 清 电视 ( 黑色 ) 松下 VIERA TC-L32C5 32 英寸 720p 60Hz 液晶 高 清 电 视 
全 新 : 379-99 美 元 。249.99 美元 起 全 新 :3249:99 美 元 点 击 查看 商品 详情 

47 件 全 新 249.99 美元 起 15 件 全 新 && 非 全 新 219.95 美元 起 

14 件 非 全 新 201.95 美元 起 19 小 时 内 下 单 并 选择 单 日 配送 ，10 月 8 日 周一 可 送 达 

19 小 时 内 下 单 并 选择 单 日 配送 ，10 月 8 日 周一 可 送 达 食 食 食 食 个 回 (8) 

食 食 食 食 妆 回 (95) 可 享受 免费 配送 

可 享受 免费 配送 商品 描述 :“……C5 (32 英寸 级 ) 是 720p 液 晶 高 清 电视 
商品 描述 :“ 东 芝 32C120U 32 英寸 720p 60Hz 液晶 高 清 电视 ” ( 冷 阴 极 背 光 ) …… 


图 6-3 亚马逊 上 的 两 台 高 清 电 视 列 表 


注 : 右 侧 商品 平均 评级 较 高 ， 为 4.5 星 ， 而 左 侧 商品 为 4 星 。 但 左 侧 商 品 的 评分 人 数 更 多 ， 为 
95 人 ， 右 侧 商品 为 8 人 


应 该 选择 哪 一 个 ? 年 一 看 ， 右 边 的 似乎 是 更 好 的 选择 ， 因 为 它 有 
更 高 的 评级 : 4.5 星 8 


我 们 漏 掉 了 什么 吗 ? 让 我 们 想 想 这 些 数字 是 如 何 确定 的 。 亚 马 进 
允许 顾客 对 其 购买 产品 发 表 评 论 。 这 些 评论 包括 三 个 部 分 


1. 评级 ， 也 就 是 所 给 的 星 级 数 ( 即 1、2、3、4 或 5) ; 
2. 文字 评论 ， 这 解释 了 为 什么 给 某 个 评级 ; 


3. 说 明 有 多 少 人 认为 该 评论 “有 用 ”的 提示 。 


某 件 商 品 的 所 谓 平 均 顾 客 评价 (也 就 是 图 6-3 中 的 4 和 4.5) 是 所 有 
顾客 对 商品 的 平均 评级 。 它 试图 总 结 评论 者 的 意见 ， 并 采取 单一 数字 
的 形式 。 对 于 大 多 数 没 有 时 间 逐 一 阅读 评论 的 人 来 说 ， 这 征 有 帮助 
的 。 但 我 们 考虑 这 个 总 结 评级 时 ， 是 否 应 该 关注 给 出 评级 的 人 们 ， 考 
虑 他 们 的 个 人 声誉 和 所 发 表 评论 的 总 数 ? 


谢 析 平均 数 


在 图 6-3 中 ， 有 8 人 为 右边 的 高 清 电视 评级 ， 而 有 95 人 为 左边 的 评 
级 。 这 对 平均 顾客 评价 有 什么 意义 ? 直观 地 说 ， 如 果 更 多 的 人 对 一 件 
商品 发 表 评论 ， 那 么 他 们 的 平均 评级 就 更 值得 信赖 ， 它 更 不 容易 受到 
有 过 严 ( 即 发 表 比 其 他 人 评分 较 低 的 评论 ) 或 过 宽 〈 即 发 表 比 其 他 人 
评分 较 高 的 评论 ) 倾向 者 的 影响 ， 也 不 容易 受 没有 用 过 产品 的 人 随机 
发 表 的 评论 的 影响 。 要 理解 这 点 ， 假 设 一 件 产品 已 获得 一 个 3 星 评论 。 
如 果 有 人 决定 随机 输入 5， 平 均 评级 将 变 为 ; 
本 和 


4 


这 整整 有 一 星 的 差异 。 如 有 果 一 开始 有 101 个 3 星 评论 ， 然 后 如 采 有 
人 随机 输入 5， 平 均 评级 只 会 变 为 : 
101 x 3+ 5 
es 


3.02 


保留 小 数 点 后 一 位 〈 这 是 亚马逊 的 做 法 ) ，3 星 的 平均 评级 会 保持 


不 变 。 


显然 ， 并 非 所 有 的 5 星 评价 都 过 于 宽松 ， 也 不 是 所 有 的 1 星 评价 都 
太 可 刻 。 这 些 评论 实际 上 对 购物 者 很 有 用 。 事 实 上 ， 亚 马 逊 在 视觉 上 


突出 关于 其 产品 “最 有 帮助 ”的 正面 和 “最 有 帮助 ”的 负面 评论 ， 从 而 对 
比 人 们 总 体 上 认为 最 有 帮助 的 极端 评论 。 你 可 以 在 图 6-4 中 看 到 一 个 例 
子 : 两 个 评论 的 星 级 数 差别 很 大 (4:1) ， 但 从 认为 其 有 帮助 的 人 数 来 
看 ， 两 个 评论 都 受到 欢迎 。 


最 有 帮助 的 好 评 最 有 帮助 的 差 评 
106 人 中 有 104 人 认为 以 下 评论 有 用 533 人 中 有 502 人 认为 以 下 评论 有 用 
食 广 女 广 妆 电视 不 错 ， 但 算 不 上 特别 好 友人 安 在 2012 款 中 ， 他 们 减少 了 2011 同 款 中 的 很 
LG 的 中 低 端 电视 有 游戏 延迟 低 、 襄 色 准 确 度 高 和 在 相 多 功能 
E 其 至 更 高 价格 7 水 平 的 电视 里 功能 和 画面 选择 最 广泛 在 2012 款 中 ， 他 们 减 少 了 2011 / 2010 同 款 中 的 很 多 
的 名 声 。 CS560 系 系列 在 这 些 方面 仍然 能 做 到 ， 但 表现 vs] 功能 。 原 ee 清楚 。 我 想 只 是 为 J - 赚 更 多 的 钱 ， 从 顾 
在 如 以 前 的 型 号 客 身上 和 花 到 多 站 2 他 们 删除 了 这 么 多 使 这 ; 款 电视 
和 n 直 的 功 日 价格 不 日 手 区 
| 电视 直 理 和 质量 生 整 体 上 非常 好 。 四 So OO 


图 6-4 亚马逊 突出 关于 其 产品 最 有 帮助 的 好 评 和 差 评 


不 过 ， 我 们 可 能 会 猜测 ， 一 件 产 品 有 越 多 评论 ， 平 均 评级 越 可 能 
值得 信赖 。 所 以 再 看 看 图 6-3， 我 们 不 能 马上 束 说 ， 基 于 8 个 评分 的 4.5 
星 平均 顾客 评级 比 基 于 95 个 评分 的 4 星 平 均 顾 客 评级 更 好 。 


评论 可 靠 性 


评论 也 许 古 不 可 信 的 。 然 而 ， 它 们 在 我 们 生活 中 的 许多 方面 都 很 
重要 : 从 网 上 购买 各 种 商品 ， 到 前 雇主 写 的 推荐 信 ， 表 到 学 生 写 的 诬 
程 评 价 。 要 提高 评论 的 可 靠 性 ， 需 要 采取 什么 方法 ? 


一 方面 ， 我 们 需要 科 选 出 “* 差 ?的 评级 方法 。 葵 止 人 们 匿名 评论 和 
限制 每 人 对 每 件 商品 发 表 一 个 评论 都 是 很 好 的 开端 ° 如果 亚 马 进 没有 
这 些 机 制 ， 结 果 会 怎样 ? 如 条 鲍 邯 在 亚马逊 销售 产品 ， 他 可 以 对 目 己 
的 商品 输入 许多 好 评 ， 来 提高 目 己 的 平均 顾客 评价 ， 并 且 每 次 都 是 匿 
名 发 表 ， 这 样 就 没有 人 会 知道 他 在 给 目 己 刷 评分 。 此 外 ， 如 采 他 发 现 
某 件 闫 品 与 目 己 的 产品 竞争 销售 ， 他 可 以 对 其 输入 大 量 差 评 。 即 使 采 
取 这 两 种 沛 选 方 法 后 ， 还 需要 考虑 许多 其 他 低 质 量 的 评级 来 源 。 例 
如 ， 你 可 以 随机 输入 与 产品 无 关 的 评论 (如 含有 自己 网 站 的 链接 ) 。 


因此 ， 在 考虑 其 他 问题 之 前 ， 我 们 需要 检查 用 于 输入 评论 的 机 
制 。 谁 能 发 表 评 论 ? 顾客 在 多 大 程度 上 被 鼓励 发 表 评论 ? 你 需要 先 购 
买 产 品 ， 然 后 才能 评论 吗 ? 刚 创 建 账 户 的 人 可 以 发 表 评论 吗 ? 此 外 ， 
进行 评价 能 输入 的 数字 范围 是 多 少 ? 例如 ， 和 人 入 们 注意 到 ，1~10、1~3 
和 1~5 的 范围 会 引起 不 同 的 心理 反应 。 


这 些 因素 提出 了 棘手 的 问题 ， 评 价 没 有 唯一 “正确 ”的 答案 ， 而 是 
取决 于 正在 评论 的 产品 类 型 : 电影 (如 互联 网 电影 数据 库 ) 评论 非常 
主观 ， 电 子 产品 《如 亚 马 了 进 ) 则 相对 客观 得 多 ， 而 酒店 (如 猫 途 座 ) 
和 和 餐厅 (如 Yelp) 则 介 于 两 者 之 间 。 它 们 还 取决 于 评论 者 的 质量 : 例 
如 ， 亚 马 逊 通过 和 发布“ 最 佳 评论 者 排行 榜 *， 对 提交 有 用 评论 的 人 进行 
奖励 。 如 采 茶 个 评论 者 全 年 排名 较 高 ， 将 被 提升 到 “名 人 符 ”。 在 这 个 
类 别 中 的 人 应 该 会 得 到 更 多 信任 。 不 过 ,信誉 很 难 进 行 量化 。 


面 对 这 些 挑 战 ， 你 可 能 会 认为 汇 忌 意见 不 太 可 能 有 效 。 但 也 有 明 
显 的 例外 。 


二 个 内皮 匠 赛 过 诸 久 膨 


早 在 1906 年 ， 英 国 普 利 茅 斯 的 一 座 农场 举行 了 一 场 有 趣 的 比赛 。 
在 一 场 家 畜 展 哎 会 上 ， 一 头 公 牛 被 展 出 ， 村 民 们 负 员 猜测 它 的 体重 。 
787 个 参与 者 中 ， 每 个 人 都 仔细 观察 了 这 头 牛 ， 然 后 在 一 张 纸 上 写 下 目 
己 的 估 测 结果 ， 中 间 没 有 和 任何 人 交流 (图 6-5) 。 


图 6-5 
注 : 1906 年 ， 一 头 牛 在 英国 的 一 座 农场 里 展 出 ， 大 约 有 800 名 村 民 试 图 猜测 它 的 重量 。 虽 然 每 


个 人 的 估 值 都 相差 甚 远 ， 但 所 有 估 值 的 平均 值 和 正确 答案 仅 相差 1 磅 


弗朗西斯 .高 尔 顿 事 士 是 当时 著名 的 统计 学 家 ， 负 责 统计 结果 。 怎 
一 看 ， 他 看 到 五 花 八 门 的 数字 ， 从 非常 低 到 非常 高 ， 其 中 没有 一 个 数 
字 是 真正 的 重量 1 198 磅 和 。 但 值得 注意 的 是 ， 当 他 计算 出 所 有 估 测 结 
果 的 平均 值 后 ， 结 果 是 数字 1 197 磅 ， 与 真实 数值 相差 不 到 0.1%。 即 使 
中 位 数 (所 有 数值 中 间 的 数字 ) 1 207 磅 与 真实 数值 相差 也 不 到 0.8% 。 


既然 每 个 人 的 佑 测 结 采 彼此 相去 甚 远 ， 为 什么 位 单 的 平均 值 却 能 
如 此 接近 真实 数值 ? 有 几 个 关键 因素 发 挥 作用 ， 使 平均 值 如 此 准确 。 
首先 ， 任 务 相 对 容易 : 猜测 牛 的 体重 有 客观 的 答案 ， 包 含 明 确 的 数字 
意义 。 此 外 ， 佑 测 是 公正 的 : 每 个 人 都 仔细 观察 了 牛 ， 所 以 没有 猜测 
太 低 或 太 高 的 系统 倾 问 。 另 外 ， 佑 测 是 独立 的 : 没有 村 民 看 到 其 他 人 
的 数字 ， 所 以 没有 人 受到 其 他 人 的 影响 《类似 于 密封 拍卖 原理 ， 见 第 4 
章 ) 。 最 后 ， 有 不 少 人 参加 猜测 活动 。 


这 些 因素 是 高 尔 顿 显 闭 结 末 的 核心 ， 但 每 一 个 因素 在 评论 创作 中 
只 在 不 同 程度 上 存在 。 


群众 的 智慧 


现在 回 到 亚马逊 ， 我 们 的 希望 是 ， 当 我 们 将 顾客 对 产品 的 评级 进 
行 平 均 ， 结 果 将 接近 正确 的 评级 。 但 我 们 能 说 “正确 ”的 评级 存在 吗 ? 
这 是 否 至 少 取决 于 具体 顾客 〈 例 如 ， 某 一 系列 T 恤 可 能 对 一 个 人 有 吸 
引力 ， 但 对 另 一 个 人 没有 吸引 力 ) ? 一 般 来 说 ， 正 如 我 们 在 高 尔 顿 的 
实验 中 看 到 的 ， 有 三 个 因素 十 汇总 个 人 意见 时 需要 考虑 的 : 


。 任 务 定义 : 一 个 定义 明确 、 目 的 清晰 一 致 的 任务 〈 例 如 猜 
数字 ) 更 适合 于 意见 汇总 。 


。 独立 和 无 偏见 的 观点 : 意见 汇总 的 成 功 不 是 取决 于 许多 可 
能 猜测 正确 的 聪明 人 ， 而 是 取决 于 每 个 人 独立 于 他 人 的 公正 看 法 。 


。 人 数 : 如 果 参 与 人 数 较 少 的 话 ， 高 尔 顿 的 实验 也 不 会 如 此 有 


wt 
注 


对 亚马逊 上 的 产品 进行 评论 定义 明确 吗 ? 不 完全 。 对 于 哪些 因素 
构成 评级 中 的 一 颗 星 ， 观 癌 因 人 而 异 。 亚 马 逊 的 评论 是 相互 独立 的 
吗 ? 有 一 点 儿 。 即 使 你 在 输入 目 己 的 评论 前 ， 可 以 看 到 现 有 的 评论 ， 
通常 你 的 评级 也 不 会 受到 太 多 影响 。 但 有 时 一 件 丙 品 的 评论 是 对 最 近 
评论 的 回应 ， 以 反驳 或 加 强 这 些 观点 (这 是 序 叶 决策 的 一 个 例子 ， 我 
们 将 在 第 四 部 分 具体 讨论 ) 。 一 般 来 说 ， 任 务 越 不 明确 ， 评 论 越 不 独 
立 ， 我 们 束 需 要 更 多 “猜测 ?来 获得 可 信 的 平均 值 。 如 果 我 们 有 适当 的 
机 制 来 检测 不 一 致 或 低 质量 的 评论 ， 束 可 以 减少 所 需 人 数 。 


当 这 三 个 因素 都 实现 时 ， 意 见 汇总 效果 极 好 。 比 如 说 ， 有 1 000 个 
人 在 玩 一 个 “猜谜 ? 族 戏 ， 游 戏 有 清晰 明确 的 任务 。 最 后 ， 我 们 收集 每 
个 预 估 数 值 并 进行 平均 。 事 实证 明 ， 我 们 可 以 在 数学 上 预计 ， 相 比 每 
个 单独 预 估 数 值 的 预期 误差 ， 该 平均 值 的 误差 将 减少 1 000 倍 ; 


各 估 值 预期 误差 
人 数 


平均 值 预期 误差 = 


前 提 是 所 有 估 值 均 是 独立 的 。 
个 等 式 把 我 们 目前 讨论 的 内 容 体现 为 数学 形式 ;群众 的 智慧 
(wisdom of crowds) 。 只 要 每 个 人 都 独立 地 猜测 ， 并 且 不 带 任何 
系统 性 偏差 ， 我 们 可 以 预计 ， 他 们 作为 一 个 群体 的 “集体 预测 ”的 准确 
性 将 与 人 数 成 比例 提高 (图 6-6) 。 所 以 ， 如 果 有 5 人 ， 准 确 性 将 提高 5 
倍 ， 如 果 有 10 人 ， 将 提高 10 倍 ， 以 此 类 推 。 群 众 是 明智 的 ， 即 使 其 中 
没有 任何 一 个 人 能 如 此 明智 。 在 图 6-7 中 ， 你 可 以 看 到 一 个 将 此 原理 应 


用 于 五 人 组 预测 的 示例 。 


包 己 
图 6-6 


F 多 人 的 综合 知识 将 超越 个 人 或 少数 人 的 能 


== 到 eo 
二 eo 


tt 


下 


注 : 基于 群众 的 智慧 ， 


中 
[3 站 让 2 


平均 值 = 3/1=3 平均 值 = (3+2+3+4+4)/5=16/5=3.2 


= 误差 "IY 5=0.2 


图 6-7 


我 们 从 左边 的 一 个 人 开始 ， 其 预期 误差 是 1。 当 增加 到 五 人 ， 平 均值 3.2 的 误差 预计 将 减 
少 5 倍 ， 前 提 是 每 个 人 的 估 值 都 是 独立 和 公正 的 


此 时 ， 你 可 能 有 两 个 关于 这 个 方程 的 问题 。 首 先 ， 为 什么 会 有 <， 
而 不 是 等 号 ? 这 意味 着 两 者 关系 是 约 等 ， 而 不 是 完全 相等 ， 部 分 是 因 
为 ， 我 们 讨论 的 是 概率 (更 多 信息 ， 请 参考 本 书 网 站 Q6.1 部 分 ) 。 第 
二 ， 我 们 说 的 “误差 ”到 的 指 什么 ?这 个 公式 中 的 “误差 ”站 格 说 来 不 是 
指 预测 值 和 实际 值 之 间 的 差异 ， 而 是 指 这 个 差 值 的 平方 。 我 们 将 在 第 7 
划 具 体 讨论 平方 误差 。 


汇总 评级 很 难 


如 果 亚 马 迎 上 有 某 产 品 的 大 量 评论 ， 之 前 的 讨论 是 否 意 味 着 ， 
均 评 级 将 接近 我 们 想 要 的 “真相 ”? 不 一 定 。 我 们 只 是 指出 了 一 些 复 
的 问题 ， 比 如 观点 不 (完全) 独立 。 


po 


其 他 困难 也 会 产生 。 回 到 图 6-3， 例 如 ， 有 两 台 价 格 接近 的 高 请 电 
视 机 ， 平 均 评 级 不 同 : 东芝 电视 机 为 来 自 95 次 评分 的 4 星 ， 而 松下 电视 
机 为 来 目 8 次 评分 的 4.5 星 。 顾 客 面临 权衡 ， 要 么 选择 具有 较 低 平均 评 
级 和 较 大 评分 人 数 的 产品 ， 要 么 选择 有 较 高 平均 评级 和 较 小 评分 人 数 
的 产品 。 


即使 两 个 产品 有 类 似 的 平均 评级 和 评分 人 数 ， 评 级 分 布 也 可 


台 已 介 、 
月 安 


有 所 不 同 。 例 如 ， 图 6-8 中 的 两 款 手电 简 的 平均 买 家 评分 均 为 4.5 星 ， 
且 评 分 数量 接近 。 而 65% 的 人 给 美光 手电 简 5 星 ，8% 的 人 给 1 星 ; 62% 
的 评分 者 给 菲尼克斯 手电 简 5 星 ，2% 的 人 给 1 星 。 因 此 ， 美 光 的 高 分 和 
低 分 比例 均 较 高 。 较 大 的 变量 使 平均 评级 更 值得 信赖 ， 还 是 更 值得 怀 
疑 ? 这 是 一 个 主观 问题 ， 没 有 明确 的 答案 。 


买 家 评论 


美光 M2A106 五 号 电池 迷你 手电 简 ， 银 色 


260 条 评论 
5 呈 : 国 (169) 
4 星 : 图 (41) 
3 星 : 和 (18) 
2 星 : | (12) 
1 星 〖 (20) 


买 家 评论 


平均 买 家 评论 


食 人 女人 女人 娘 帮 260 条 买 家 评论 


与 其 他 买 家 分 享 你 的 想法 


创建 你 的 评论 


菲尼克斯 E01 微型 LED 手电 简 


183 条 评论 平均 买 家 评论 

py .A rt B14 
5 星 ， 国 于 到] (114) 人 不 人 龙 廊 廊 友 183 和 杀 天 家 评论 
4 呈 : 图 (45) 与 其 他 买 家 分 享 你 的 想法 
3 星 : 上 (15) 
2 星 : (5) 创建 你 的 评论 
1 星 : (4) 

图 6-8 


上 似 ， 但 评分 变化 情况 不 同 


注 : 亚马逊 销售 的 两 种 手 昌 


最 后 ， 


产品 获得 的 评级 可 


简 ， 平 均 评分 和 评分 人 数 才 


台 已 公 、 
有 全 


随时 间 波 动 。 例 如 ， 在 图 6-9 中 ， 你 


可 以 看 到 亚 马 进 上 某 件 产品 60 个 最 近 评 级 和 60 个 最 有 用 的 评级 随时 间 


而 变化 的 对 比 情况 。 最 近 评 级 的 平均 值 为 3.6， 大 大 低 于 最 有 帮助 的 评 
级 平均 值 (4.4) 。 最 近 评级 反映 了 真正 的 变化 〈 如 产品 的 一 个 新 缺 
陷 ) 或 只 是 正常 波动 ? 哪个 更 适合 作为 平均 买 家 评价 ? 同样 ， 这 些 问 
题 的 答案 是 主观 的 ， 对 汇总 意见 提出 了 另 一 个 挑战 。 


最 近 最 有 帮助 
5 5 
4 4 
3 : 连 
2 2 
1 1 

时 间 时 间 

图 6-9 


注 : 图 为 亚马逊 某 产品 最 近 ( 左 ) 和 最 有 帮助 的 〈 右 ) 评级 之 间 的 比较 


找到 一 个 “好 ”排名 方法 


在 第 二 部 分 ， 我 们 讨论 了 谷歌 用 来 排列 项 目 列表 的 不 同方 法 。 亚 
马 逊 等 电子 商务 公司 也 有 排名 列表 〈 即 指定 类 别 的 产品 列表 ) 的 方 
案 ， 以 帮助 天 家 高 效 浏览 大 量 项 目 。 我 们 将 介绍 其 中 一 种 方法 ， 它 被 
称 为 贝 叶 斯 排名 ， 并 且 在 实践 中 已 被 广泛 采用 。 然 而 ， 亚 马 逊 并 没有 
透露 目 己 的 排名 算法 细 有 。 


简单 平均 


表 6-1 显 示 了 亚马逊 的 五 台 DVD 播 放 机 的 评级 。 每 个 类 别 中 的 星 
数 和 评论 总 数 均 已 给 出 。 让 我 们 先 用 这 些 数 字 来 计算 亚马逊 显示 的 每 
个 产品 的 平均 评级 。 


如 何 做 到 这 一 点 ? 我 们 把 所 有 星 数 相 加 ， 除 以 评论 总 数 。 对 于 松 
下 ， 有 5 个 5 星 评级 ， 共 有 5x5 = 25 颗 星 ; 3 个 4 星 评级 ， 共 有 4x3 = 12; 
3 个 3 星 评级 ， 共 有 3x3 = 9; 没有 2 星 或 1 星 评级 。 所 有 星 数 是 25+12+9 
= 46， 评 论 总 数 是 5 + 3+ 3 = 11， 所 以 平均 为 46 111 = 4.182 。 


其 他 四 件 商品 呢 ? 你 可 以 遵循 相同 的 程序 ， 得 到 以 下 结 末 : 
18x5+9x4+5x3+2x2+3x1l 148 


索尼 : 二 4 
L893 3 2 3 37 
忆 币 渍 19% 中 十 11 WSw9T 区 并 Bl, sg 
23 二 ] 信 十 11 站 全 丰 13 67 
革 家 二 生 二 
乔 带 菜 。] 因 共生 十 1 下 十 ZW 十 GX24 1%1 _ 125 _ ,jo 
18+ 14+2+0+11 S1 
于 十 
东芝 . 19xS+ 10x4+ 10x 3 4x2+1x1_ 184_, ,07 
19+ 10+ 10+ 4+ 11 354 


如 果 把 它们 按 平 均 评 级 从 最 高 到 最 低 排 刚 ， 顺 序 从 上 到 下 如 表 6-1 


所 示 。 
表 6-1 亚马逊 的 五 台 DVD 播 放 机 的 评级 


DVD 播放 机 5 星 4 星 3 星 2 星 1 星 共计 


松下 5 3 3 0 0 11 
索尼 18 9 5 2 3 37 
利 浦 23 15 11 5 13 67 
柯 带 斯 18 14 2 6 11 51 
东芝 19 10 10 4 11 54 
共计 83 51 31 17 38 220 


这 征 “ 正 确 ?的 顺序 吗 ? 回 到 我 们 之 前 的 问题 : 如 果 一 个 产品 只 有 2 
个 评分 ， 即 使 都 是 5 星 ， 也 应 该 被 排 在 有 100 个 评分 ， 平 均 为 4.5 星 的 苋 
和 搜 产 品 之 前 吗 ? 直观 地 说 ， 这 将 是 错误 的 ， 我 们 正面 临 这 个 问题 : 松 
下 有 最 高 平均 评级 4.182， 但 评论 数 也 最 少 。 


贝 叶 斯 排序 原理 


我 们 如 何 将 不 同 数量 的 评论 纳入 考虑 ? 我 们 应 该 用 人 数 来 衡量 原 
台 评 分 。 知 道 评 论 数 量 使 我 们 提前 了 解 ， 我 们 可 以 对 其 加 以 利用 。 


因此 ， 除 了 将 每 个 产品 分 开 考 虑 ， 让 我 们 把 所 有 相关 产品 的 信息 
进行 整合 。 类 似 于 计算 每 个 产品 平均 评级 的 方法 ， 我 们 可 以 算出 所 有 
产品 的 总 平均 评级 。 结 果 是 什么 ? 如果 我 们 将 图 6-10 中 的 各 列 数字 相 
加 ， 将 得 到 每 个 星 级 的 总 数 ， 如 最 后 一 行 所 示 。 然 后 我 们 可 以 计算 : 
83x3+31x4+31x3+ 17x2+ 38x1l1 784 


= 3.564 
83 dl 3 dT 28 220 


这 个 整体 平均 评级 基于 220 个 总 评级 。 直 观 地 说 ， 我 们 可 以 将 其 作 
为 每 个 单独 产品 的 备份 评级 。 一 个 产品 的 评级 越 多 ， 其 平均 评级 相对 
于 整体 平均 值 束 越 可 信 。 在 这 种 情况 下 ， 我 们 应 该 更 加 重视 个 别 评 
级 。 相 反 ， 一 个 产品 的 评级 越 少 ， 其 平均 值 束 越 不 可 和信。 在 这 种 情况 
下 ， 我 们 应 该 倾向 于 相信 整体 平均 评级 。 


我 们 可 以 将 其 看 成 个 别 和 整体 之 间 的 “滑动 标尺 *?， 如 图 6-10 所 
示 : 调整 后 的 个 别 评级 位 于 两 者 之 间 。 对 于 每 个 产品 ， 调 整 值 可 以 通 
过 以 下 公式 确定 : 


个 列 < 束 休 个 别 > 归 全 _ 
调整 凋 整 
个 别 个 别 整体 个 别 个 别 
平均 值 平均 值 。” 平均 值 平均 值 平均 值 
图 6-10 


注 : 调整 后 的 平均 评级 位 于 个 别 和 整体 平均 值 之 间 。 在 左边 的 情况 下 ， 产 品 的 个 别 平 均值 小 
于 整体 ， 在 右边 ， 个 别 平均 值 大 于 整体 


整体 数量 x 整体 平均 值 + 个 别 数量 x 个 别 平均 什 


整体 数量 + 个 别 数量 


贝 叶 斯 排序 (Bayesian ranking) 是 贝 叶 斯 统计 方法 下 的 推理 
方法 之 一 。 这 类 统计 法 以 英国 牧师 和 数学 家 托马斯 : 贝 叶 斯 命名 。 他 于 
18 世 纪 中 期 发 现 其 基本 定理 的 一 个 特例 。 (主要 工作 实际 上 是 由 皮 埃 
尔 -西蒙 - 拉 普 拉 斯 完成 ， 他 于 18 世 纪 末 再 次 独立 发 现 该 原理 ， 并 进行 
延伸 。) 


有 趣 的 是 ， 在 整个 19 世 纪 和 20 世 纪 很 长 一 段 时 间 里 ， 贝 叶 斯 派 理 
论 遭 到 所 谓 频 率 统计 学 家 的 否定 甚至 强烈 抵制 。 他 们 倾 回 于 从 数据 中 
做 出 推 亲 和 估计 的 经 典 方 法 。 但 多 年 来 ， 贝 叶 斯 派 理 论 被 用 来 解决 一 
些 频 率 统计 方法 无 法 攻克 的 重大 问题 。 这 里 有 几 个 历史 上 的 例子 : 


* 19 志 纪 90 年 代 ， 法 国 军官 阿尔 弗 雷 德 : 德 雷 福 斯 被 诬陷 犯 下 才 
国 菲 ， 数 学 家 孕 利 ' 庞 加 茉 引 用 贝 叶 斯 定理 来 证 明 其 清 日 。 

二战? 期 间 ， 英 国 计 算 机 移 驱 阿兰 ' 图 灵 使 用 贝 叶 斯 系统 破译 
德国 军 方 通信 密码 。 

* 20 世 纪 五 六 十 年 代 ， 哈 佛 和 芝加哥 的 研究 人 员 使 用 贝 叶 斯 派 
分 析 方 法 ， 表 明 有 争议 的 《联邦 先 人 人 文集》 很 可 能 由 詹姆斯 :麦迪 
撑 所 着 ， 而 非 亚 力 山大 :汉密尔顿 。 


随 看 时 间 的 推移 ， 这 些 成 功 的 例子 与 计算 技术 的 进步 逐渐 增加 了 
贝 叶 斯 建 模 的 接受 程度 。 到 21 世 纪 ， 它 已 被 广泛 接受 。 今 天 ， 它 被 用 
于 机 器 学 习 和 大 数据 分 析 等 领域 。 让 我 们 明确 一 点 ， 贝 叶 斯 建 模 确实 
有 其 风险 ， 但 它 揭 示 了 一 些 值得 讨论 的 群众 智慧 。 


假设 总 评级 数 为 100， 总 平均 值 为 2 星 。 如 有 果 其 中 一 个 产品 有 来 目 5 
个 评论 的 4 星 平 均值 ， 那 么 该 产品 的 贝 氏 评级 是 什么 ? 利用 方程 ， 我 们 
得 到 : 


]00x2+3x4 220 
= = 2.10 
100+5 105 


这 距离 2 比 距离 4 近 得 多 。 这 是 有 道理 的 ， 因 为 个 别 评级 数 远 远 小 
于 总 评级 数 ， 所 以 我 们 更 依赖 后 者 。 相 反 ， 如 果 4 星 平均 值 基 于 40 个 评 
论 ， 那 么 贝 氏 评 级 将 上 升 到 ; 

100x2+40x4 360 


A 
这 已 远离 2 (图 6-11) 。 
2 4 
yp 六 | 
S99 一 一 
整体 |  . i 个 别 
平均 值 平均 值 
5 条 评论 40 条 评论 
图 6-11 


注 : 在 我 们 的 例子 中 ， 评 论 数 从 5 增加 到 40， 会 使 调整 后 的 平均 值 从 2.1 变 为 2.57， 更 接近 个 别 
平均 值 100x2+40x4=360=2.57 


让 我 们 在 图 6-10 的 例子 中 应 用 贝 叶 斯 法 调整 ， 看 顺序 是 否 有 变 
化 。 记 得 总 评级 数 为 220， 我 们 计算 的 整体 平均 评级 为 3.564。 那 么 ， 
松下 播放 机 的 调整 值 是 多 少 ? 该 商品 有 11 个 评级 ， 其 个 别 平 均值 为 
4.182， 通 过 贝 叶 斯 公式 得 出 : 
220 x 3.564 + 11 x 4.182 784.08+ 46.002 
220+ 11 ”220+11 


= 35393 


经 过 贝 叶 斯 法 调整 后 ， 注 意 到 松下 的 评级 已 非常 接近 平均 值 3.564 
了 吧 ? 为 什么 ? 由 于 该 播放 机 评级 数 (11) 相对 于 总 数 (220) 较 小 ， 
这 使 得 整体 平均 值 在 公式 中 的 权重 大 得 多 。 其 他 DVD 播放 机 的 计算 按 
照 同样 方式 进行 : 


索尼 : 220 x 3.564 + 37 x 4.000 784.08 + 148 


320 + 37 2207537 3020 
飞利浦 ， 220x 3.564 + 67 x 3.448 _ 784.08+ 231.016 _ ,537 
220+ 67 220 + 67 
2 +5 各 
问 带 斯 ，220x 3.564 + 51 x 3.431 _ 784.08+ 174.981 _ ,539 
220+ 51 220+ 51 
+ 5 + 
和 六 220* 3.564 + 54x 3.407 _ 784.08+ 183.978 _ 3 533 
220+ 54 220 + 54 


结果 是 什么 ? 现在 ， 按 照 贝 氏 评级 ， 产 品 排名 从 最 高 到 最 低 分 别 
为 索尼 、 松 下 、 柯 带 斯 、 飞 利 浦和 东芝 。 你 可 以 在 表 6-2 中 看 到 运用 贝 
叶 斯 排名 前 后 的 并 列 对 比 情况 。 经 过 贝 叶 斯 法 调整 后 ， 松 下 和 索尼 播 
放 机 ， 以 及 飞利浦 和 柯 蒂 斯 播放 机 互相 交换 了 位 置 。 此 外 ， 所 有 评级 


都 更 接近 平均 值 
表 6-2 基于 原始 平均 值 和 贝 叶 斯 调整 值 的 DVD 播放 机 排名 比较 
简单 平均 贝 叶 斯 法 调整 
DVD 播放 机 评级 数 

排名 评级 排名 评级 

松下 11 ] 4.182 2 3.593 

索尼 37 2 4 ] 3.626 

攻 利 浦 67 3 3.448 4 3.537 

柯 蒂 斯 51 4 3.431 3 3.539 

东芝 54 5 3.407 5 3.533 


在 这 个 例子 中 ， 贝 叶 斯 法 调整 显然 改变 了 产品 顺序 。 但 调整 后 的 
评级 不 会 在 所 有 人 情况 下 都 改变 顺序 。 你 能 想到 一 个 排名 保持 不 变 的 例 
子 吗 ? 


实践 中 的 贝 叶 斯 排序 


不 少 网 站 在 实践 中 采用 了 贝 叶 斯 排序 。 例 如 ， 互 联网 电影 数据 库 
的 250 佳 电影 列表 完全 遵循 之 前 的 方程 。 有 了 时， 最 好 对 用 来 调整 评级 
的 “整体 数量 ”设置 最 大 值 。 随 着 时 间 的 推移 ， 所 有 产品 的 评级 总 量 将 


保持 上 升 ， 贝 叶 斯 调整 评级 的 数值 范围 将 变 得 越 来 越 小 。 最 终 ， 我 们 
将 有 针对 如 此 多 产品 的 如 此 多 的 评级 ， 以 至 于 每 次 使 用 该 方程 ， 基 本 
上 都 会 默认 采用 整体 平均 值 。Beer Advocate 的 啤酒 排名 

(http://beeradvocate.com/lists/popular) 为 了 避免 这 个 问题 ， 试 图 通过 
选择 “整体 数量 ”作为 需要 在 页 面 上 列 出 的 最 小 评论 数目 。 


在 本 部 分 讨论 中 ， 我 们 假设 产品 评级 有 单一 、 真 实 的 数值 ， 与 我 
们 期 望 它 对 顾客 的 符合 度 对 应 。 但 事实 上， 真相 因 人 而 异 。 某 些 产品 
只 会 产生 两 极 反应 : 有 些 人 喜欢 ， 而 有 些 人 讨厌 。 你 可 以 在 图 6-12 中 
看 到 亚 马 过 上 索尼 DVD 播放 机 的 一 个 例子 : 一 方面 ， 大 多 数 人 给 它 4 
星 或 5 星 评级 ， 另 一 方面 ， 有 的 人 给 1 星 ， 而 2 星 和 3 星 评级 则 不 常见 。 
有 了 时， 只 有 带 着 这 两 种 强烈 感受 之 一 的 人 才 愿 意 写 评论 。 这 样 的 评级 
集合 被 称 为 遵循 多 重 模 态 分 布 ( 即 包含 许多 中 心 ) 。 虽 然 我 们 关注 单 
峰 分 布 ， 但 贝 叶 斯 分 析 也 可 以 扩展 到 多 重 模 态 的 情况 。 


买 家 评论 
索尼 DVP-SR200P/B DVD 播放 机 ， 黑 色 


529 条 评论 平均 买 家 评论 
5 中 ， 国 国生 (281) 依依 全 禄 广 529 条 买 家 评论 
4 呈 : 图 (118) 其 他 买 家 分 享 你 的 想法 
3 星 : 上 (39) 
2 星 : | (18) 创建 你 的 评论 
1 星 : 出 (73) 
图 6-12 


注 : 对 亚马逊 上 的 产品 产生 两 极 反 应 的 例子 : 一 些 人 很 喜欢 ， 给 它 4 星 或 5 星 ， 而 其 他 人 讨厌 
它 ， 给 它 1 星 

最 后 ， 我 们 要 提 醒 ， 贝 叶 斯 法 调整 只 适用 于 调整 可 比 产品 系列 的 
评级 (如 一 组 DVD 播放 机 ， 一 组 笔记 本 电脑 ) 。 它 不 能 简单 地 用 于 调 


整 不 同 产品 的 评级 (如 任意 一 组 电子 产品 ) 。 将 一 组 对 象 作 为 整体 进 
行 评 级 ， 需 要 有 一 个 使 调整 值 有 意义 的 整体 平均 值 。 


此 时 ， 你 可 能 会 想 知 道 : 亚马逊 具体 是 如 何 对 产品 列表 进行 排名 
的 ? 它们 实际 上 按照 某 一 个 秘密 公式 ， 将 平均 评论 与 至 少 三 个 其 他 因 
素 结合 : 根据 评论 人 数 进行 贝 叶 斯 法 调整 (如 我 们 在 本 部 分 的 讨 
论 ) ， 评 论 的 新 旧 程度 ， 以 及 评论 者 的 声誉 得 分 。 具 体 公 式 不 为 亚 马 
还 以 外 的 人 所 知 ， 但 如 果 你 有 兴趣 阅读 天 于 其 排名 如 何 确 定 的 一 个 具 
体例 子 ， 请 参考 本 书 网 站 Q6.2 部 分 。 


到 目前 为 止 ， 我 们 已 经 看 到 ， 对 网 站 上 输入 的 评论 进行 评级 让 
总 ， 对 于 了 解 产 品 的 “真相 ?是 有 用 的 。 和 群众 智 营 是 网 络 中 的 一 个 重要 
原则 ， 它 指导 了 许多 组 合 人 们 意见 的 算法 设计 。 下 一 步 ， 我 们 将 关注 
网 飞 的 电影 推荐 ， 它 不 是 为 所 有 人 形成 一 个 评级 ， 而 古 为 每 个 人 部 预 
测 多 个 评级 。 


1. 1 磅 x0.45 千 克 。 一 一 编者 注 


第 7 章 
推荐 观看 的 影片 


继续 我 们 关于 意见 汇总 的 主题 ， 现 在 转向 推荐 。 从 广义 上 讲 ， 产 
品 推荐 利用 现 有 的 产品 评级 知识 ， 建 议 顾客 下 一 步 消费 什么 。 


如 有 果 你 是 网 飞 的 用 户 (图 7-1) ， 你 可 能 已 经 处 于 其 电影 推荐 的 接 
收 端 。 它 们 如 何 确定 〈 它 们 认为 ) 哪些 是 你 最 有 兴趣 观看 的 影片 ? 进 
行 推荐 时 它们 需要 利用 已 有 的 关于 用 户 仿 好 的 数据 ， 来 预测 它们 没有 
的 电影 评级 。 这 往往 假定 和 利用 群众 的 智慧 .他们 开始 时 拥有 的 评级 
数 越 多 ， 其 预测 结果 就 会 越 好 。 


图 7-1 网 飞 的 商标 标识 


大 规模 在 线 播放 电影 


在 1997 年 ， 曾 有 一 个 人 对 在 音像 店 积 累 的 大 笔 滞 纳 金 感到 十 分 洱 
来 。 他 所 认为 的 “逾期 "是 一 种 新 的 收费 模式 ， 与 其 每 次 租赁 时 间 人 人 们 
收取 费用 ， 何 不 按 月 同 他 们 收取 固定 费用 昵 ? 其 他 机 制 ， 如 同一 时 间 
可 以 租借 的 电影 数量 限制 ， 则 可 以 用 来 激励 人 们 归还 DVD 。 


里 德 : 哈 斯 廷 斯 就 古 这 个 故事 的 主角 。 他 于 同年 成 为 网 飞 的 一 位 创 
始 人 。 网 飞 最 初 作为 传统 实体 DVD 出 租 店 ， 实 行 每 次 租赁 定价 收费 模 
式 。 随 着 电子 商务 开始 飞速 发 展 (在 第 6 章 提 到 过 ) ， 他 们 于 1998 年 创 
办 网 上 商店 ， 人 允许 人 们 在 线 购买 DVD， 并 等 待 邮 寄 送 达 。 然 后 ， 在 
1999 年 ， 他 们 引入 按 月 收取 会 员 费 的 模式 ， 顾 客 每 月 向 网 飞 文 付费 
用 ， 而 不 是 每 次 租赁 时 付费 。 在 这 个 方案 下 ， 用 户 可 以 将 租 来 的 电影 
保留 目 己 布 望 的 时 间 长 度 ， 但 对 用 户 可 以 同时 借 出 的 数量 有 限制 。 


多 年 来 ， 网 飞 已 经 具有 民 好 的 用 户 可 扩展 性 和 黏 性 。 可 扩展 性 意 
味 着 网 飞 在 已 经 有 很 多 用 户 的 前 担 下 ， 获 得 一 个 痢 用 户 的 成 本 大 大 下 
降 。 秋 性 意味 着 那些 已 经 使 用 网 飞 服务 的 用 户 往往 会 继续 使 用 ， 而 不 
征 改 用 羽 一 个 视频 提供 商 。 


到 2008 年 ， 在 美国 和 加 拿 大 约 有 900 万 名 网 飞 用 户 ， 这 个 数字 相 比 
世纪 之 交 时 增加 了 10 倍 。 大 约 从 这 个 时 候 起 ， 网 飞 转向 男 一 种 娱乐 提 
供 形式 : 通过 互联 网 疝 联 网 设备 提供 流 媒 体 电影 和 电视 节目 。 这 些 设 
备 包括 所 有 我 们 每 天 都 在 使 用 的 产品 : 电视 机 、 机 项 盒 、 智 能 手机 、 
游戏 机 等 。 这 种 形式 的 租赁 服务 已 经 在 很 大 程度 上 超越 传统 音像 店 ， 
例如 ， 百 视 达 于 2010 年 申请 破产 ， 并 转 回 邮件 投递 领域 。 


视频 流 使 网 飞 用 户 数量 扶 摇 直 上 ， 到 2015 年 达到 6 600 万 ， 比 2008 
年 增加 7 倍 多 。 目 前 ， 网 飞 公司 是 美国 领先 的 视频 流 媒体 服务 提供 商 。 
在 所 有 家 庭 中 ， 有 369% 订 阅 网 飞 服务 ， 而 亚 马 过 和 Hulu Plus (两 者 是 
网 飞 最 大 的 竞争 对 手 ) 分 别 为 13% 和 6.5%。 有 趣 的 是 ， 网 飞 视频 流 在 
2011 年 3 月 产生 了 巨大 流量 ， 占 互联 网 所 有 数据 流量 的 114。 在 一 些 统 
计数 据 中 ， 这 个 数字 更 高 。 


推 存 :“ 读 心术 ”游戏 


网 飞 提供 耕 干 功能 来 帮助 你 选择 电影 。 在 进行 选择 前 ， 你 可 以 按 
类 型 过 滤 ， 按 评级 排序 ， 看 影评 家 的 选择 ， 参 考 网 飞 前 100 佳 影片 ， 等 


和 
地 


站 


这 些 功能 中 的 一 部 分 是 "一刀切 ” 式 ， 对 你 和 对 别人 显示 的 内 容 一 
样 。 但 网 飞 也 会 癌 你 推荐 它 认 为 你 会 喜欢 的 电影 。 好 像 它 在 读 你 的 
心 ， 在 你 观看 或 进行 评价 之 前 ， 吏 预测 哪些 内 容 会 适合 你 的 口味 ! 


这 是 如 何 进行 的 ? 当 你 使 用 网 飞 时 ， 他 们 会 在 数据 库 中 建立 关于 
你 的 行为 的 历史 数据 。 这 些 信息 被 输入 算法 ， 来 预测 你 将 如 何 给 其 他 
电影 评级 。 你 提交 评级 ， 添 加 电影 到 播放 队列 ， 或 者 告诉 网 飞 哪些 是 
你 不 感 兴趣 的 ， 这 些 行 为 都 会 影响 未 来 哪些 影 族 将 被 推荐 给 你 。 


一 个 有 效 的 推荐 系统 (recommendation system) 对 于 网 飞 很 
重要 ， 因 为 它 改 进 了 用 户 体 验 ， 提 高 了 用 户 的 忠诚 展 ， 并 有 助 于 库存 
控制 。 除 了 视频 分 配 ， 这 些 系统 在 许多 其 他 应 用 中 也 很 重要 。 例 如 ， 
在 第 6 章 中 ， 我 们 谈 到 亚马逊 如 何 得 出 某 个 产品 的 平均 评级 和 排名 。 类 
似 的 做 法 是 亚马逊 如 何 根据 你 的 购买 和 浏览 历史 ， 辐 你 推荐 产品 ， 并 
在 你 每 次 浏览 时 进行 调整 。 另 外 ， 在 第 9 章 中 ， 我 们 将 简要 介绍 
YouTube 如 何在 你 观看 结束 时 ， 向 你 推荐 视频 。 


网 飞 公 司 一 直 倡 导 一 个 超越 传统 推荐 方案 的 系统 ， 利 用 其 收集 的 
所 有 用 户 行 为 的 丰富 历史 ， 建 立 档 案 ， 记 录 每 个 用 户 的 电影 品味 ， 以 
及 用 户 如 何 对 每 部 电影 评级 。 其 算法 发 现 电 影评 级 “群众 ”提供 的 数据 
中 隐藏 的 模式 ， 并 以 此 建立 这 些 模型 。 让 我 们 仔细 看 看 这 个 系统 的 输 
入 和 输出 ， 如 图 7-2 所 示 。 


图 7-2 


每 次 用 户 对 电影 进行 评级 ， 其 评级 束 会 被 存储 在 网 飞 的 数据 库 
中 。 这 些 数据 的 集合 构成 了 系统 的 输入 信息 。 每 个 评级 包含 四 组 数 
字 : 用 户 身份 电影 编号 、 星 级 数量 (从 1 到 5) ， 以 及 评级 日 期 。 


这 个 输入 量 有 多 大 ? 非常 大 。 网 飞 有 超过 6 000 万 名 用 户 ， 加 上 75 
000 个 不 同 的 电影 标题 ， 共 有 超过 4 万 亿 (4 000 000 000 000) 组 可 能 的 
用 户 和 电影 评级 配对 。 当 然 ， 这 些 评 级 中 只 有 一 小 部 分 是 实际 存在 
的 ， 因 为 只 有 一 小 部 分 用 户 看 过 某 部 电影 ， 其 中 又 只 有 一 部 分 愿意 给 
它 打 分 。 换 名 话说， 这 个 数据 集 十 分 稀疏 ， 因 为 这 些 可 能 的 条 目 中 只 
有 一 小 部 分 是 真正 存在 的 〈 记 得 我 们 在 第 5 章 说 过 网 络 图 是 稀 玻 的 ) 
尽管 如 此 ， 数 据 库 中 输入 的 用 户 和 电影 评级 配对 总 数 仍然 达到 几 十 
亿 。 


我 们 可 以 用 一 张 图 表 直 观 地 表示 这 些 输 入 信息 ， 行 代表 用 户 ， 列 
代表 电影 ， 如 图 7-2 左 侧 所 示 。 对 于 表 中 的 每 个 元 素 ， 其 位 置 表示 
(1) 哪个 用 户 ; (2) 哪 部 电影 ， 条 目 本 身 表示 ; (3) 星 级 评级 。 问 
号 (? ) 表示 未 知 评级 。 


这 些 输入 信息 是 用 来 做 什么 的 ? 它们 被 用 来 调整 系统 预测 算法 的 

不 同 参数 。 你 可 以 把 参数 看 作 一 个 可 调 的 旋钮 或 按钮 ， 改 变 参 数 的 值 

( 即 转动 旋钮 ) 会 对 系统 输出 的 结果 产生 一 些 影响 。 输 入 数据 用 于 系 
统 的 训练 阶段 ， 将 参数 设置 为 期 望 产生 高 质量 输出 的 数值 。 


输出 


推荐 系统 会 输出 给 我 们 什么 ? 首先 ， 输 出 是 一 组 预测 值 ， 表 示 用 
户 会 给 自己 还 没有 看 过 电影 的 评级 。 这 在 图 7-2 的 右 侧 显 示 ， 其 中 图 左 
侧 的 问号 已 被 一 些 预 测 值 奉 换 。 你 看 到 这 些 输出 值 包含 小 数 (也 就 是 
说 ， 它 们 不 只 是 1 到 5 之 间 的 整数 ) 。 我 们 如 何 进行 解读 ? 比如 说 ， 预 
测 值 4.2 介 于 4 和 5 之 间 ， 但 更 接近 4， 其 20% 靠 向 5，80% 靠 向 4。 所 以 我 
们 可 以 将 4.2 解 释 为 ， 用 户 有 20% 的 概率 会 给 这 部 电影 5 星 ， 有 80% 的 概 
率 会 给 它 4 星 。 


不 过 ， 这 些 预测 评级 并 不 是 最 终 真 正 显示 给 观众 的 形式 。 系 统 最 

终 输 出 的 是 一 系列 推荐 给 个 人 用 户 的 简短 、 有 序 排列 的 电影 列表 。 我 

们 如 何 使 用 预测 ， 来 确定 推荐 给 每 个 用 户 的 列表 十 什 么 ? 我 们 可 以 使 

用 不 同 的 标准 。 例 如 ， 我 们 可 以 推荐 用 户 还 没 看 的 预测 评级 最 高 的 5 部 
影 ， 或 所 有 预测 评级 超过 4 星 的 电影 。 


评估 预测 


我 们 如 何 确 定 这 种 系统 的 质量 或 性 能 ?真正 的 检验 方法 是 ， 有 多 
少 用 户 真 的 喜欢 推荐 给 他 们 的 电影 。 但 是 这 个 信息 很 难 收集 。 相 反 ， 
我 们 需要 一 些 可 以 作为 指标 的 度量 值 。 


如 果 除 了 对 我 们 未 知 的 评级 做 出 预测 ， 也 对 已 知 评 级 做 出 预测 ， 
结果 会 怎样 ? 那样 我 们 就 可 以 知道 ， 我 们 对 已 知 评级 的 预测 与 实际 数 
值 的 匹配 程度 如 何 。 两 者 匹配 度 越 高 ， 我 们 对 未 知 评级 的 预测 束 可 能 
越 准 确 。 这 种 思路 种 用 来 评 佑 以 下 类 型 的 系统 : (1) 使 用 一 些 数 据 来 


调整 系统 的 参数 ; 《2) 使 用 系统 来 预测 目标 值 (有 的 已 知 ， 有 的 未 
知 ) ; (3) 比较 已 知 目标 的 预测 值 与 实际 值 ， 以 了 解 预 期 质量 。 


< 号 知 


o> 
i 


未 知 


图 7-3 


注 ， 对 于 评估 ， 已 知 数据 ( 即 数据 库 中 已 有 的 评级 ) 被 分 成 两 组 ， 一 组 用 于 训练 ， 一 组 用 于 
评估 


要 做 到 这 一 点 ， 我 们 必须 确保 将 训练 和 评价 中 使 用 的 数据 分 开 ， 
如 图 7-3 所 示 。 这 两 组 数据 都 是 已 知 的 ， 但 它们 必须 是 不 同 的 ， 因 为 我 
们 需要 测试 算法 预测 其 没有 见 过 的 评级 的 能 力 。 换 名 话说， 在 训练 阶 
段 ， 我 们 需要 隐瞒 〈 或 保持 ， 因 为 它 是 已 知 的 ) 来 自我 们 输入 系统 的 
数据 的 评价 等 级 。 


一 旦 我 们 将 预测 和 实际 评级 进行 比较 ， 如 何 确定 质量 ? 一 个 标准 
方法 是 均 方 根 误差 (root mean square error) ， 缩 写 为 RMSE 。 
它 的 定义 既 长 又 抛 口 :， 找到 数据 集 上 所 有 点 的 误差 ， 将 其 平方 ， 找 到 
均值 ( 即 平均 数 ) ， 并 计算 平方 根 。 我 们 也 可 以 参考 均 方 误差 ， 这 市 


省 了 最 后 一 步 (平方 根 ) 。 例 如 ， 将 数字 1、2 和 3 作为 三 个 值 的 误差 ， 
将 其 平方 得 出 12=1x1=1,， 22=2x2=4，32=3x3=9。 平 均 数 为 : 


十 4 十 
二 4 -46 


这 是 均 方 误差 。 然 后 计算 平方 根 得 出 均 方 根 误 差 : \4.67 = 
2.16。 均 方 根 误差 (或 均 方 误差 ) 越 低 ， 系 统 输出 的 预期 质量 就 越 


[可 


在 对 评级 预测 算法 进行 具体 讨论 之 前 ， 让 我 们 看 看 它们 在 网 飞 的 
历史 上 发 挥 了 多 么 重要 的 作用 。 


网 飞 大 奖 赛 


网 飞 最 初 的 预测 算法 是 CineMatch。 意 识 到 拥有 最 好 的 评级 预测 算 
法 有 多 么 重要 后 ， 网 飞 于 2006 年 10 月 推出 了 一 项 挑战 赛 。 这 场 公 开 、 
在 线 、 跨 国 的 比赛 称 为 网 飞 奖 (Netflix Prize) ， 提 供 100 万 美元 奖 
金 给 能 在 CineMatch 的 水 平 上 将 均 方 根 误差 改善 10% 的 团队 。 


比赛 开始 时 ， 网 飞 向 公众 公布 了 一 组 包括 1 亿 多 个 评级 的 数据 ， 这 
是 其 1999 年 到 2005 年 间 记 录 中 的 一 部 分 。 在 2006 年 ， 这 一 数据 量 可 以 
法 进 标准 台式 电脑 的 内 存 ， 使 世界 上 任何 人 都 能 轻松 参加 比赛 。 评 级 
数据 来 自 480 000 多 个 用 户 和 17 770 部 电影 。 平 均 每 部 电影 被 超过 5 000 
个 用 户 评 级 ， 平 均 每 个 用 户 给 超过 200 部 电影 进行 过 评级 。 


这 个 数据 集 是 参赛 者 检验 其 算法 所 需 的 。 它 是 否 有 足够 的 信息 来 
为 每 个 用 户 进 行 预测 ? 乍 一 看 ， 似 乎 如 此 。 进 一 步 分 析 后 ， 事 实证 
明 ， 只 有 少数 用 户 通过 评估 大 量 电 影 (有 一 个 用 户 为 超过 17 000 部 电 
影评 级 ! ) 将 这 个 平均 值 提高 至 200。 对 于 大 多 数 用 户 来 说 ， 只 有 少 
数 评级 ， 这 对 汇总 用 户 个 人 喜好 构成 了 一 个 有 趣 的 挑战 。 


网 飞 把 只 有 其 有 权 得 知 的 几 百 万 条 评级 从 训练 数据 中 提出 。 测 试 
集中 的 140 万 条 评级 将 作为 最 终 的 评估 标准 ， 以 确定 获胜 者 。 
CineMatch 对 测试 集 的 均 方 根 误差 为 0.952 5， 网 飞 为 参赛 者 定 的 目标 为 
将 测试 集 的 均 方 根 误 差 降 低 至 0.9x0.952 5 = 0.857 3。 这 似乎 没有 太 多 
区 别 ， 但 是 哪怕 将 均 方 根 误差 降低 0.01， 在 最 后 的 推荐 中 都 能 产生 显 
著 差 异 。 


总 体 而 言 ， 这 场 比赛 激发 了 近年 来 推荐 系统 研究 方面 最 激烈 的 活 
动 。 全 球 5 000 多 个 团队 提交 了 超过 44 000 条 结果 。2006 年 10 月 ， 比 赛 
开始 仅 一 周 ，CineMatch 就 被 打败 ， 但 直到 几乎 3 年 后 的 2009 年 6 月 ， 才 
有 团队 将 误差 水 平 改 善 了 10%。 最 后 ， 前 两 名 团队 ，The Ensemble 和 
BellKor’s Pragmatic Chaos， 对 测试 集 的 均 方 根 误差 均 改善 了 10.06%。 
由 于 后 者 提交 算法 时 间 比 前 者 早 20 分 钟 ， 因 此 他 们 被 宣布 成 为 获胜 
者 o 


关于 这 场 比赛 的 进展 情况 和 对 数据 集 进行 训练 和 评价 分 区 的 更 多 
细节 ， 请 参考 本 书 网 站 Q7.1 和 Q7.2 部 分 。 


建立 基线 预测 值 


对 于 网 飞 数 据 集 的 均 方 根 误 过， 要 取得 最 后 百 分 之 几 的 进步 ， 需 
要 将 很 多 算法 组 合 在 一 起 ， 将 成 千 上 万 个 模型 参数 调整 妥当 。 我 们 无 
意 解释 这 些 程序 所 涉及 的 细 市 。 相 反 ， 我 们 将 关注 最 初 环 节 中 的 两 
步 : 基线 预测 和 邻 式 模 型 ， 并 尽 可 能 位 化 其 中 涉及 的 数学 概念 。 正 如 
你 将 看 到 的 ， 在 这 些 方法 内 部 是 这 样 的 概念 : 我 们 可 以 利用 已 有 数 
据 “ 群 "中 的 信息 ， 推 断 用 户 喜 好 和 电影 特征 ， 以 进行 预测 。 


我 们 的 数据 集 示 例 


请 看 图 7-4 中 的 数据 集 示例 。 它 包含 6 个 用 户 (A~F) ， 每 行 一 
个 ， 以 及 5 部 电影 (I~V) ， 每 列 一 部 。 既 非 黑 体 也 非 问 号 的 条 目 将 被 
用 来 作为 训练 数据 ， 作 为 我 们 预测 的 基础 。5 个 黑体 条 目 将 作为 测试 数 
据 ， 这 样 我 们 就 可 以 评 们 我 们 对 此 数据 集 的 算法 性 能 。5 个 问号 是 系统 
预测 的 最 终 输 出 。 
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图 7-4 包含 6 个 用 户 (A~F) 和 5 部 电影 (I~V) 的 数据 集 示 例 


显然 ， 比 起 网 飞 包含 数 百 万 名 用 户 和 数 万 部 电影 的 数据 集 规模 ， 
这 个 例子 是 小 亚 见 大 焉 。 同 时 ， 网 飞 的 数据 更 为 稀 芒 : 在 我 们 的 例子 
里 ， 表 中 有 839% 的 条 目 填充 了 内 容 ， 而 网 飞 只 有 所 有 可 能 评级 中 的 不 
到 19%6。 不 过 ， 这 个 小 数据 集 足 以 说 明 主 要 观点 。 


简单 预测 值 


如 何 建立 预测 式 ? 对 于 初学 者 ， 我 们 可 以 尝试 计算 训练 集中 所 有 
条 目的 平均 值 ， 并 应 用 于 所 有 未 知 的 条 目 。 对 于 训练 数据 中 的 20 个 数 
字 ， 结 果 为 


和 寺中 生 十 六 于 半 于 本 第 训 十 才 十 wm 本 
20 


你 可 以 在 图 7-5 的 右 侧 看 到 这 一 结 采 。 
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图 7-5 原始 评级 〈 左 ) 和 简单 预测 值 ( 右 ) 

让 我 们 通过 计算 均 方 误差 ， 以 评估 这 一 预测 值 的 质量 ， 我 们 可 以 
将 其 简称 为 “误差 >”。 如 前 所 述 ， 我 们 必须 采用 “平方 差 * 的 平均 值 。 我 
们 将 关注 该 测试 集 ， 但 可 以 在 训练 集 上 采用 相同 的 步骤 。 

首先 ， 对 于 测试 集中 的 每 个 元 素 ， 我 们 找 出 原始 评级 和 预测 评级 
之 间 的 差 值 ， 并 平方 。 以 用 户 B 和 电影 IV 为 例 : 预测 值 为 3.5， 原 始 评 
级 是 3， 因 此 平方 差 为 (3-3.5) 2 = 0.25。 用 户 D 和 电影 1 如何? 结果 是 
(2_3.5) 2=2.25° 


一 旦 我 们 得 出 图 7-5 测 试 集中 每 个 点 的 平方 差 ， 就 能 算出 所 有 这 些 
值 的 平均 值 


(4— 3.5) + (2— 3.5) + (5— 3.5) + (3— 3.5) + (4— 3.5) 


5 
2 22 25 
5 


= 1.050 
对 于 训练 数据 ， 你 可 以 得 出 误差 为 1.350。 


基线 预测 值 


依赖 网 飞 数据 集 的 整体 平均 评级 会 相当 幼稚 。 这 吏 像 在 第 6 章 ， 对 
亚马逊 上 的 所 有 产品 使 用 相同 的 平均 买 家 评论 一 样 。 也 许 我 们 可 以 把 
那 章 中 学 到 的 两 点 结合 :一些 评 论 者 往往 更 加 宽松 (苛刻 ， 同 时 有 
的 项 目 〈 在 这 种 情况 下 是 电影 ) 本 来 就 比 其 他 的 更 好 (更 差 ) 。 


例如 ， 看 看 用 户 D。 她 给 的 最 高 评级 是 3， 这 是 给 电影 (II) 的 ， 
该 电影 得 到 其 他 用 户 的 评级 均 为 4 和 5。 她 还 给 了 两 个 ， 并 且 实 际 上 是 
唯一 给 评级 1 的 人 。 因此， 用 户 DD 似 乎 是 一 个 苛刻 的 评论 者 ， 她 给 电影 
II 的 预测 评级 应 该 能 反映 出 这 一 点 。 同 时 ， 看 看 电影 HI:， 除了 一 个 评 
级 3 (来 自 苘 刻 的 评论 者 D) ， 它 得 到 的 都 是 4 和 5。 我 们 预计 这 部 电影 
更 可 能 得 到 那些 尚未 评级 者 的 好 评 。 


换 句 话说 ， 每 个 用 户 和 每 部 电影 都 有 其 评级 偏差 。 基 线 预 测 值 
(baseline predictor) 假设 ， 特 定 用 户 -电影 对 儿 的 评级 会 被 相应 偏 
差 从 整体 平均 值 中 抵消 ， 也 就 是 : 


评级 = 平均 值 + 用 户 偏差 + 电影 偏差 


我 们 已 经 知道 如 何 得 到 (整体 ， 平 均值 。 那 么 偏 项 呢 ? 我 们 可 以 
通过 考虑 用 户 与 电影 的 相互 作用 ( 即 某 个 用 户 如 何 给 电影 评级 ， 以 及 
某 部 电影 如 何 被 用 户 评级 ) 来 计算 偏 项 。 在 一 般 情况 下 ， 要 找到 可 能 
的 最 佳 值 ， 我 们 需要 解决 一 个 优化 问题 。 比 起 这 样 做 ， 让 我 们 采取 一 
个 直观 的 方法 : 对 于 某 个 用 户 ， 找 到 其 对 所 有 评级 电影 (在 训练 数据 


中 ) 的 平均 评分 ， 并 与 整体 平均 值 比较 。 如 果 它 更 高 ， 这 表示 他 相 比 
整个 数据 集 有 多 么 宽容 ， 如 有 果 更 低 ， 这 表示 他 有 和 多么 苛刻 。 同 样 ， 对 
于 每 一 部 电影 ， 我 们 找 出 所 有 用 户 给 它 的 评级 ， 并 与 整体 平均 值 进行 
比较 。 


回 到 图 7-4。 对 于 苛刻 的 用 户 D， 有 四 个 评级 的 训练 数据 : 2、3、 
1 和 2。 因 此 ， 


偏差 D = 3.5=— 1.5 


2+3+1+2 
4 


这 明显 低 于 零 ， 正 如 我 们 所 预计 的 : 她 的 平均 评级 远 低 于 整体 平 
均值 。 好 电影 II 怎么 样 ? 也 有 四 个 评级 : 4、5、3 和 5。 因 此 ， 


Se 十 5 十 3 十 
稿 关 II = < 2 3.5= 0.75 


正如 我 们 所 预计 的 ， 结 末 大 于 零 。 你 可 以 以 同样 的 方式 算出 其 余 
偏 项 。 数 值 在 图 7-6 中 ， 在 行 (用 户 ) 和 列 (电影 ， 的 末尾 。 


有 了 这 些 偏 项 ， 我 们 可 以 做 出 基线 预测 。 对 于 用 户 D 评 级 电影 
II， 我 们 将 得 到 什么 结果 ? 


平均 值 + 偏差 D + 偏差 II = 3.5 - 1.5 + 0.75 = 2.75 


0.30 -1.17 0.75 -0.50 0.10 
图 7-6 用 户 和 电影 偏 项 在 对 应 行列 ) 末尾 


这 距离 用 户 D 的 实际 评级 只 有 0.25。 选 取 我 们 没有 的 评级 ， 我 们 对 
用 户 A 和 电影 HI 会 得 到 什么 结果 ? 


平均 值 + 偏差 A + 偏差 I = 3.5 + 0.83 - 1.17 = 3.16 


你 可 以 对 30 个 用 户 - 电 影 对 儿 中 的 每 一 个 重复 这 个 过 程 。 图 7-7 碳 
侧 显 示 完 整 的 基线 预测 。 你 会 注意 到 ， 没 有 一 个 预测 值 低 于 1 
一 个 高 于 5。 为 什么 ? 当 预 测 值 超出 这 个 范围 (例如 ， 对 于 用 户 E， 

影 III， 预 测 值 为 3.5 + 0.83 + 0.75 = 5.08) ， 如 果 保 持原 样 ， ee 
差 更 严重 ， 因 为 实际 评级 不 可 能 超过 5 或 低 于 1。 我 们 应 该 始终 将 预测 
评级 限制 在 这 个 范围 内 。 
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A 4.43 
B 41 
> c 
D 
E | 4.63 
F | 4.05 


图 7-7 基线 预测 值 显示 在 右 侧 


那么 ， 使 用 基线 预测 时 的 误差 是 多 少 ? 比较 图 7-7 中 测试 集 的 预测 
与 实际 评级 ， 我 们 得 出 : 


(4— 2.80) + (2— 1.00) + (5— 5.00) + (3— 3.50) + (4— 3.83)” 
5 


_ 1.44+ 1.00+ 0.00+ 0.25+ 0.023 
5 


= 0.543 


相 比 简单 预测 的 测试 集 误 差 1.050， 我 们 提高 了 (1- 0.543 / 
1.050) x100% = 48%。 你 可 以 得 出 训练 数据 的 基线 预测 误差 为 0.223， 
它 相 比 1.350 提 高 了 83%。 不 错 啊 ! 


“久居 ”的 帮助 


到 目前 为 止 ， 我 们 一 直 在 计算 评级 数据 各 行 或 各 列 的 平均 值 ， 以 
找到 用 户 与 电影 的 相互 作用 。 如 果 利 用 不 同 电影 和 不 同 用 户 之 间 的 相 
似 性 ， 结 果 会 怎样 ? 这 是 邻 式 模型 (neighborhood model) 的 精 
艇 ， 如 果 两 个 用 户 关 于 电影 有 特别 相似 (或 不 同 ) 的 意见 ， 或 者 两 部 
电影 的 用 户 评级 特别 相似 (或 不 同 ， 我 们 便 称 之 为 “邻居 ”。 邻 式 模 
型 是 协同 过 滤 (collaborative filtering) 中 一 个 更 直观 的 方法 ， 我 


们 通过 观察 实体 如 何 “ 合 作 ” (在 这 种 情况 下 ， 其 如 何 评级 或 被 评 
ee 


相似 性 和 相 异 性 


假设 安娜 和 本 都 喜欢 电影 《心灵 捕手 》 和 《美丽 心灵 》， 同 时 都 
不 喜欢 《狮子 王 》 和 《阿拉 本 》， 如 图 7-8 所 示 。 在 这 种 情况 下 ， 安 娜 
和 本 似乎 是 正 相 关 (positively correlated) 用 户 ( 即 他 们 有 类 似 的 
喜好 ) 。 所 以 ， 如 果 我 们 知道 安娜 喜欢 《 侏 罗 纪 公 园 》， 0 
也 喜欢 它 ， 如 果 我 们 知道 安娜 不 喜欢 它 ， 我 们 预计 本 也 不 会 喜欢 
相关 性 也 反 回 成 立 : 如 果 本 不 喜欢 前 两 部 电影 ， 而 喜欢 后 两 部 ， A 
安娜 和 本 似乎 高 度 负 相 关 (negatively correlated) 。 在 这 种 情况 
下 ， 如 果 安 娜 喜欢 《 侏 罗 纪 公园 》， 我 们 预计 本 不 喜欢 它 ， 反 之 亦 


《 狮 子 王 》 让 当 


《心灵 捕手 让 《美丽 心灵 》 


图 7-8 


注 : 两 个 用 户 对 电影 倾向 于 有 相同 观点 时 ， 他 们 具有 相似 性 


再 举 一 个 例子 。 假 设 《 心 灵 捕 手 》 和 《美丽 心灵 》 痢 获得 安娜 和 
本 的 高 评级 ， 并 且 都 获得 查理 的 低 评级 。 那 么 ， 如 果 达 娜 给 《心灵 捕 
手 》 高 评级 ， 我 们 预计 她 也 会 给 《美丽 心灵 》 高 评级 ， 因 为 别人 的 意 
见 表 明 这 两 部 电影 呈正 相关 〈 即 有 相似 的 类 型 、 质 量 等 ) 。 同 样 ， 如 
果 达 娜 给 其 中 一 部 电影 低 评级 ， 我 们 预计 她 也 会 给 另 一 部 低 评级 。 反 
之 亦 然 ， 你 可 以 在 图 7-9 中 看 到 : 如 采 安 娜 、 本 和 查理 给 《美丽 心灵 》 
与 给 《心灵 捕手 》 的 评级 相反 ， 那 么 这 两 部 电影 硅 负 相关 ， 我 们 预计 
达 娜 也 会 给 这 两 部 电影 相反 的 评级 。 


不 同 的 电影 


《心灵 捕手 》|《 美 丽 心灵 》 


图 7-9 两 部 电影 获得 用 户 反 馈 相 反 则 相 异 


我 们 如 何 量 化 相似 性 的 概念 ? 标准 度量 称 为 余弦 相似 度 
(cosine similarity) 。 对 其 进行 计算 需要 一 点 儿 几 何 知识 ， 所 以 我 
们 不 会 进行 具体 的 数学 运算 。 如 果 你 对 其 中 的 细 市 感 兴趣 ， 请 参考 本 
书 网 站 Q7.3 部 分 。 电 影 间 相似 度 的 计算 结果 在 图 7-10 中 给 出 。 例 如 ， 
根据 这 张 表 ， 我 们 可 以 说 ， 电 影 II 和 IV 之 间 的 相似 度 为 0.50。 
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图 7-10 电影 与 电影 间 的 相似 度 表 
注 : 在 每 部 电影 的 列 中 ， 与 其 最 接近 的 电影 被 高 亮 显示 
我 们 如 何 解释 这 些 数值 ? 这 里 有 几 个 重要 的 余弦 相似 度 性 质 ， 将 
给 我 们 提供 帮助 : 


eT 


* 它 上 * 
“ 完全 正 相 关 值 为 1。 一 个 接近 1 的 值 是 强 正 相关 ( 即 有 很 高 
度 ) 


一 个 接近 -1 的 值 是 强 负 相关 ( 即 有 很 高 


完全 无 相关 值 为 0。 一 个 接近 0 的 值 表 示 只 有 弱 相 关 《 即 既 不 
相似 ， 也 不 相 异 ) 。 


我 们 可 以 对 电影 II 和 V 进 行 何 种 推测 呢 ? 因为 0.79 接 近 1， 因 此 这 
两 部 电影 呈正 相关 。 从 图 7-4 的 评级 看 ， 这 是 有 道理 的 ， 用 户 A 和 B 对 
这 两 部 电影 的 评级 都 比较 高 ， 用 户 D 对 这 两 部 电影 的 评级 都 比较 低 

(我 们 无 法 考虑 其 他 用 户 ， 因 为 他 们 没有 对 训练 集 里 的 两 部 电影 评 
级 ) 。 电 影 I 和 II 怎 么 样 ? 因为 ~- 0.11 和 1 或 - 1 都 不 接近 ， 这 就 是 说 ， 它 
们 既 不 正 相 天 ， 也 不 人 负 相 关 。 


明智 地 选择 你 的 近邻 


这 些 电影 之 间 的 相似 度 值 ， 或 者 用 户 之 间 的 相似 度 ， 古 我 们 在 建 
立 邻 式 模 型 时 所 使 用 的 数值 。 那 么 我 们 如 何 从 “相似 ”发 展 到 “近邻”? 
我 们 可 以 使 用 各 种 规则 来 确定 某 部 电影 的 近邻 。 例 如 ， 我 们 可 以 沿 着 
各 列 ， 选 择 三 部 具有 最 高 相似 度 值 的 电影 。 或 者 ， 我 们 可 以 说 ， 如 采 
任何 电影 有 高 于 某 个 装 值 的 相似 度 值 ， 那 么 它们 都 是 近邻 。 我 们 这 里 
说 的 “更 高 ? 指 的 是 绝对 值 较 高 : 可 以 是 强 正 相关 或 强 负 相关 。 这 两 种 
类 型 都 是 有 用 的 。 


为 了 简化 后 面 的 数学 计算 ， 让 我 们 为 每 部 电影 选择 最 佳 的 单个 邻 
居 。 你 可 以 在 图 7-10 中 看 到 结果 :一 个 高 亮 的 框 表示 列 中 的 电影 将 选 
择 行 中 的 电影 作为 其 近邻 。 例 如 ，V 选 择 II 作 为 其 近邻 。 这 是 否 意味 着 
[I 将 选择 V? 不 是 ， 尽 管 相似 度 值 是 对 称 (symmetric) 的 〈 即 I 对 V 
的 相似 度 和 V 对 TI 的 相似 度 相同 ) ， 近 邻 选 择 则 不 必 如 此 。II 与 I1V 的 相 
关 度 大 于 和 V 的 相关 度 ， 所 以 I[ 选 择 IV 作 为 其 近邻 。 


我 们 也 可 以 将 近邻 选择 体现 为 一 张 图 。 你 可 以 在 图 7-11 中 看 到 : 
每 部 电影 都 是 一 个 节点 ， 指 癌 它 选择 的 近邻 。 如 采 我 们 允许 电影 选择 
更 多 的 近邻 ， 图 中 每 个 节点 将 有 更 多 的 传 出 链接 。 


N 


图 7-11 最 近邻 电影 关系 图 
注 : 来 自 节点 的 连接 表示 其 最 近邻 。“N” 表 示 负 相关 ，“P” 表 示 正 相关 


现在 ， 这 些 近邻 怎么 办 ? 我 们 使 用 它们 的 方式 希望 能 提高 我 们 的 
预测 质量 。 要 做 到 这 一 点 ， 我 们 对 从 图 7-7 中 的 基线 预测 获得 的 误差 加 
以 利用 ， 硕 望 用 这 种 方法 校准 误 莹 ， 人 否则 其 可 能 从 训练 集 传导 至 测试 
集 。 通 过 从 原始 评级 中 减 去 基线 预测 值 ， 我 们 得 到 每 个 用 户 -电影 对 儿 
的 误差 ， 如 图 7-12 所 示 。 这 些 都 是 成 对 误差 〈 即 每 个 用 户 -电影 对 儿 只 
有 一 个 误差 ) 而 不 是 均 方 误差 那 种 用 来 衡量 整体 质量 的 单一 总 结 性 误 
差 。 
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图 7-12 基线 预测 误差 表 


现在 我 们 有 了 应 用 近邻 法 需要 的 所 有 条 件 。 让 我 们 先 以 电影 V 和 
用 户 C 为 例 。 电 影 V 的 最 近邻 是 I， 具 有 很 高 的 正 相 关 性 (0.88) 。 用 
户 C 对 电影 I 评级， 其 预测 误差 为 0.67。 这 个 误差 说 明 什 么 ? 我 们 的 预 
测 偏 低 0.67， 同 时 因为 电影 V 与 相似， 我 们 对 用 户 C 给 电影 V 评 级 的 预 
测 可 能 也 偏 低 。 所 以 我 们 给 2.60 的 基线 预测 加 上 0.67: 


2.60 + 0.67 = 3.27 


与 实际 评级 3 相 比 ， 这 里 的 误差 较 小 : 偏 高 了 0.27， 而 不 是 偏 低 
0.40。 


让 我 们 再 举 一 个 例子 : 用 户 B 对 电影 IV 的 评级 。 电 影 IV 的 最 近邻 
是 1， 两 者 为 完全 人 负 相 关 (-1.00) 。 用 户 B 对 电 景 A 
0.17， 表 示 预 测 偏 低 0.17。 由 于 IV 和 II 相 有 异 ， 因 此 我 们 对 用 户 B 给 
IV 的 评级 预测 可 能 过 高 。 那 么 在 这 种 情况 下 该 怎么 办 ? ne 
济 3.50 中 减 去 0.17: 


3.50 — 0.17 = 3.33 
同样 ， 这 里 的 误差 较 小 (0.33 比 0.5 小 ) 。 


所 以 ， 如 果 相 关 性 为 正 ， 那 么 我 们 加 上 近邻 的 基线 误差 ， 如 采 相 
天 性 为 负 ， 那 么 我 们 减 去 误差: 


评级 = 基线 预测 + 近邻 误差 


这 是 一 个 邻 域 预测 (neighborhood predictor) 的 简单 形式 ， 
在 这 里 我 们 只 使 用 最 近邻 。 如 前 所 述 ， 这 种 方法 可 以 扩展 到 使 用 更 多 
的 近邻 ， 但 我 们 不 会 进行 讨论 。 


我 们 可 以 将 邻 域 预测 情况 作为 第 一 部 分 提 到 的 一 种 负 反 馈 。 它 利 
用 基线 误差 作为 一 种 “反馈 信号 ”， 对 输出 中 的 并 在 “错误 ”进行 修正 ， 
忠 像 功率 控制 根据 目标 信号 质量 差异 进行 调整 那样 。 


完整 预测 显示 在 图 7-13 右 侧 ， 其 中 一 些 值 与 图 7-7 中 所 示 的 基线 预 
os 这 是 皇 么 发 生 的 ? 当 用 户 没有 对 近邻 电影 进行 评级 ， 或 者 

ee 让 时。 例如， 以 用 户 C 对 电影 [的 评级 为 
合 。 电影 I 的 近邻 是 II， 而 C 没 有 对 其 评级 。 所 以 我 们 没有 改变 基线 预 
测 。 
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图 7-13 邻 域 预测 显示 在 右 侧 


我 们 不 能 期 望 每 个 评级 的 误差 都 会 降低 。 以 用 户 F 对 电影 V 的 评级 
为 例 ， 近 邻 法 预测 评级 为 3.27， 相 比 3.85 的 基线 预测 ， 其 距离 实际 评级 
4 更 远 ! 但 即使 在 个 别 情况 下 ， 邻 域 预 测 可 能 会 偏离 ， 我 们 预计 它 整体 
上 仍然 利 大 于 次 。 要 对 此 进行 检验 ， 让 我 们 找 出 整体 误差 。 对 于 测试 
集 ,我们 得 出 : 


(4— 2.80) + (2— 1.50) + (5— 5.00) + (3— 3.33) + (4— 3.27)" 


5 
_ 1.44+ 0.25+ 0.00+ 0.11+ 0.53 
5 


= 0.466 


同样 ， 我 们 可 以 评估 训练 数据 的 误差 为 0.134， 相 比 原 来 的 简单 平 
均 预测 ， 对 测试 集 的 预测 提高 了 56%， 对 训练 集 的 预测 提高 了 90% 。 
与 基线 预测 相 比 ， 两 者 分 别提 高 了 14% 和 39% 。 


作为 总 结 ， 在 图 7-14 的 例子 中 ， 你 可 以 看 到 从 训练 数据 和 测试 数 
据 中 获得 的 各 种 预测 误差 的 比较 。 前 三 组 条 形 古 我 们 在 本 章 讨 论 方法 
的 结果。 第 四 组 显示 ， 如 末 我 们 对 每 部 电影 使 用 两 个 最 近邻 ， 而 不 只 
苹 一 个 最 近邻 ， 将 产生 什么 误差。 事实 证 明 ， 训 练 集 的 误差 保持 大 致 


相同 ， 而 在 测试 数据 上 则 显 闭 上 升 ， 所 以 在 这 种 情况 下 ， 一 个 近邻 实 
际 上 有 是 更 好 的 选择 。 


1.50 
1.350 


训练 数据 图 测试 数据 


图 7-14 在 不 同 预测 的 例子 中 使 用 训练 和 测试 数据 产生 的 误差 


我 们 以 前 说 过 ， 基 于 列 ( 行 ， 的 平均 值 计算 基 线 预 测 的 偏差 值 不 
苹 最 佳 方法 。 第 五 组 条 形 显示 ， 如 果 我 们 解决 了 偏 项 的 优化 问题 ， 将 
产生 什么 误差 : 它 降低 了 第 二 列 中 的 误差 。 最 后 显示 了 ， 如 末 我 们 使 
用 优化 基线 的 近邻 法 ， 将 产生 什么 误差 。 事 实 上 ， 事 后 看 来 ， 使 用 两 
个 近邻 将 是 更 好 的 选择 : 在 图 7-14 的 所 有 方法 中 ， 这 将 是 给 本 示例 市 
来 的 最 大 改进 。 


我 们 在 本 章 中 的 目的 ， 不 是 解释 网 飞 奖 比赛 获胜 算法 的 所 有 细 
方 。 这 需要 很 多 高 级 的 数学 技巧 。 但 十 你 现在 知道 网 飞 进行 电影 推荐 
背后 的 基本 思路 : 寻找 用 户 之 间 和 电影 之 间 的 模式 ， 并 利用 这 些 模式 
来 预测 未 知 意见 。 


第 8 章 
社会 化 学 习 


我 们 刚刚 看 到 ， 如 何 根据 从 “群众 "中 收集 的 信息 做 出 决定 。 在 本 
章 中 ， 我 们 将 讨论 人 们 互相 学 习 的 情况 ， 每 个 人 都 将 目 己 的 智慧 再 到 
人 和 群 中 。 


技术 与 教学 : 扩展 学 习 


创造 互联 网 背后 的 动机 之 一 是 ， 使 获取 内 容 变 得 更 容易 。 今 天 ， 
我 们 除了 一 次 次 地 浏 贤 特 定 的 信息 块 ， 还 可 以 参加 围绕 某 个 学 科 内 容 
组 织 的 整个 课程 。 相 比 于 去 真正 的 课堂 参加 讲座 ， 互 联网 使 我 们 有 了 
在 电脑 上 观看 讲座 视频 的 可 能 。 


正如 和 人们 所 言 ， 在 线 学 习 已 经 流行 起 来 了 。 许 多 高 等 教育 机 构 现 
在 提供 在 线 全 学 位 课程 ， 大 多 数 高 校 至 少 为 学 生 提 供 部 分 在 线 谋 程 。 
事实 上 ， 在 2012 年 秋季 ， 超 过 25% 的 大 学 生 在 网 上 至 少 学 习 了 一 门 课 
程 。 


在 过 去 10 年 中 ， 因 特 网 在 两 种 意义 上 扩展 了 学 习 。 学 习 网 上 课程 
的 总 人 数 己 经 大 大 增加 ， 在 同一 时 间 学 习 同 一 课程 的 人 数 也 大 大 增 
加 。 在 某 些 情况 下 ， 后 者 人 数 已 达到 数 10 万 ! 当 一 个 班 的 学 生 人 数 变 
得 非常 庞大 时 ， 对 于 老师 来 说 ， 要 回答 所 有 问题 并 满足 学 生 的 所 有 需 
要 束 变 得 很 有 挑战 性 了 。 学 生 和 需要 社交 性 学 习 ， 也 束 古 相互 学 习 和 指 


导 。 


远程 学 习 


说 远程 学 习 (distance learning) 始 于 互联 网 就 像 是 说 交通 始 
于 汽车 一 样 。 多 年 来 ， 大 多 数 通信 系统 被 用 来 以 各 种 方式 促进 教育 。 
一 些 学 位 课程 通过 邮寄 方式 进行 ， 将 学 习 材 料 和 作业 寄 到 人 们 家 里 ， 
这 早 在 19 世 纪 中 叶 就 已 经 出 现 。20 世 纪 早 期 和 中 期 ， 当 广播 电视 变 得 
流行 ， 一 些 大 学 也 开始 通过 这 些 类 型 的 网 络 广播 课程 讲座 。 


随 着 网 络 的 兴起 ， 在 线 课程 、 在 线 学 位 甚至 在 线 大 学 在 20 世 纪 90 
年 代 开 始 蓬勃 发 展 。 到 2003 年 ，80% 的 大 学 至 少 有 一 门 课 程 在 某 种 程 
度 上 使 用 了 在 线 技术 。 到 2014 年 ， 只 有 不 到 5% 的 公立 高 校 没有 提供 任 
何 形式 的 在 线 课程 。 


在 线 学 习 提供 了 哪些 以 前 远程 学 习 没 有 提供 的 东西 ? 对 各 种 技术 
支持 的 教学 模式 进行 比较 是 很 有 帮助 的 。 一 个 基本 场景 如 图 8-1 所 示 。 
听 教 师 讲课 (听觉 ， 看 到 正在 书写 的 信息 (视觉 ， 阅 读 材料 ( 文 
本 ) ， 与 同学 讨论 (社交 ) 并 实时 (同步 ) 提出 问题 。 正 如 我 们 在 学 
校 所 经 历 的 ， 面 对 面 的 课堂 形式 文 持 所 有 这 些 模 式 。 除 了 同步 学 习 ， 
互联 网 可 以 实现 以 上 所 有 功能 ， 它 可 以 提供 预先 录 制 好 的 讲座 视频 
(听觉 和 视觉 ) ， 学 生 讨论 论坛 (社交) ， 以 及 补充 材料 (通常 为 文 


本 ) 。 其 他 每 项 技术 只 能 支持 一 种 或 两 种 模式 。 


] 


注 ， 按 其 便于 支持 的 学 习 模式 ， 比 较 教学 中 所 应 用 的 技术 

不 同类 型 的 在 线 学 习 也 已 经 出 现 。 有 些 谍 程 开放 给 任何 人 报名 ， 
而 其 他 诬 程 被 作为 学 位 诬 程 的 一 部 分 。 一 些 诬 程 大 量 招 生 ， 而 男 一 些 
则 按照 传统 课堂 规模 招生 。 


最 新 的 在 线 学 习 类 型 可 以 追溯 到 2002 年 ， 当 时 所 省 理工 学 院 创 建 
了 一 个 免费 提供 本 校 课 程 材料 的 网 上 资源 库 ， 任 何人 都 可 以 访问 。 许 
多 人 对 这 种 大 胆 而 似乎 不 必要 的 举动 感到 困惑 。 为 什么 麻 省 理工 学 院 
决定 将 课程 材料 免费 在 线 提供 ? 厅 省 理工 学 院 如 此 广泛 地 传播 知识 ， 
会 得 到 什么 回报 ? 事实 证 明 ， 这 是 一 次 有 启发 性 的 探索 行为 ， 最 终 成 
为 一 股 潮流 ， 它 将 普通 课堂 大 小 的 在 线 课程 转变 为 舱 课 。 最 近 10 年 ， 
美国 许多 顶尖 大 学 加 入 了 这 一 行动 ， 其 中 一 半 追 随 矿 省 理工 的 倡议 ， 
与 Coursera、edX、Udacity、Udemy 等 莫 课 网 站 合作 ， 提 供 自 己 的 课 
程 。 实 际 上 ， 本 书 的 前 身 就 是 2012 年 的 第 一 门 关 于 网 络 的 慕 课 课程 。 


摹 课 (MOOC) 中 的 “MOO” 


现在 有 十 几 个 莫 课 提供 商 ， 每 个 在 操作 上 都 有 一 定 差 别 ， 但 其 中 
大 多 数 有 一 些 共同 属性 。 和 凭借 “得 课 提供 商 ” 的 名 称 ， 它 们 的 课程 在 网 
上 提供 ， 并 向 任 何人 升级 ， 要 么 免费 ,要么 费用 低廉 。 教 师 教授 莫 诬 
最 流行 的 方式 ， 十 通过 YouTube 式 的 讲座 视频 ， 在 其 中 和 藤 入 检测 问 
题 ， 如 图 8-2 所 示 。 这 些 平台 还 通过 讨论 论坛 ， 将 社交 网 络 融 入 其 中 ， 
使 学 生 可 以 互相 提问 和 回答 问题 。 


讲座 视频 视频 内 测试 
图 8-2 
注 : 讲座 视频 ( 左 ) 和 嵌入 视频 问答 测试 〈 右 ) 示例 ， 来 自 基 于 本 书 的 一 门 网 络 课程 (你 会 


在 第 14 章 看 到 该 材料 ) 


作为 开放 式 在 线 传输 的 副产品 ， 莫 课 吸 引 了 大 量 学 习 者 。“ 大 
量 ” 到 底 是 多 少 ? 一 个 标准 的 莫 课 课程 有 上 万 到 数 十 万 名 来 目 世 界 各 地 
的 学 习 者 。 想 象 和 这 么 多 人 面对面 在 真正 的 课 竺 里 吧 ! 虽然 这 在 生活 
中 似乎 不 太 可 能 ， 但 网 络 技术 的 进步 使 许多 人 有 可 能 一 起 在 虚拟 的 在 
线 谋 特 中 学 习 。 


即使 在 只 有 几 十 名 学 生 的 传统 课 和 党 里 ， 任 何 教师 都 会 尽力 解决 每 
个 人 的 所 有 问题 、 关 切 和 误解 。 作 为 教师 ， 重 要 的 工作 是 个 性 化 学 
习 (individualizing learning) 〈 即 进行 一 些 调整 ， 以 将 材料 教 给 
每 一 个 学 生 ) 。 在 莫 课 中 实现 这 一 目标 很 复杂 。 庞 大 的 规模 使 每 个 教 
师 要 对 更 多 学 生 负 责 。 开 放学 习 往 往 会 吸引 不 同 背景 的 学 生 ， 他 们 的 
背景 知识 和 对 从 课程 中 的 收获 期 望 不 同 ， 这 要 求教 师 在 一 开始 就 进行 
更 广泛 的 区 分 。 此 外 ， 如 果 师 生 只 是 在 线 互 动 ， 教 师 将 更 难 了 解 每 个 
学 生 的 学 习 需 求 。 


长 话 短 说 〈 获 得 更 多 信息 ， 请 参考 本 书 网 站 Q8.1~Q8.6 部 分 ) ， 将 
传统 教学 方法 扩展 到 莫 课 的 规模 是 具有 挑战 性 的 。“ 一 刀 切 
式 ” (one-size-fits-all) 的 教学 风格 适用 于 所 有 人 ， 但 即使 基于 课程 
的 “平均 ”学 习 需 求 进行 战略 设计 ， 它 仍然 不 太 可 能 在 许多 学 生 身 上 取 


展 好 效果 (图 8-3) 。 不 过 ， 在 线 教育 有 一 个 组 成 部 分 是 可 扩展 的 : 
会 网 络 中 发 生 的 学 习 。 这 一 点 我 们 接 下 来 将 看 到 。 


课堂 MOOC 


图 8-3 


如 采 教 师 必 须 选 择 一 种 方法 来 教 每 个 人 ， 他 最 好 的 办 法 是 基于 每 种 情况 下 的 学 习 需 求 “中 
点 ”进行 教学 。 在 课 符 里 ， 这 仍然 可 以 接近 大 多 数学 生 的 水 平 ， 但 在 敬 课 中 ， 很 多 学 生 水 平 都 


村 长远 


任 会 化 学 习 


如 有 果 鲍 动 对 所 学 课程 中 的 部 分 材料 感到 困惑 ， 他 能 做 什么 ?如果 
他 在 一 大 群 同 华中， 教师 不 太 可 能 满足 鲍 动 与 其 他 人 的 所 有 具体 学 习 
需要 。 好 处 是 ， 可 能 至 少 有 一 个 同伴 能 帮助 他 ， 而 且 也 会 有 许多 人 从 
他 的 问题 得 到 解答 中 受益 。 


我 们 在 这 里 描述 的 是 社会 化 学 习 (social learning) 的 过 程 ， 
学 生 通 过 互动 和 协作 来 学 习 。 他 们 可 以 合作 ， 讨 论 他 们 学 到 了 什么 ， 
并 回答 对 方 的 问题 。 社 会 化 学 习 是 莫 课 的 重要 组 成 部 分 ， 也 是 整个 教 
育 的 重要 组 成 部 分 。 和 群众 智慧 不 是 从 一 个 人 的 知识 中 获得 ， 而 是 从 许 
多 人 的 集体 知识 中 获得 。 


论坛 讨论 

网 上 课程 社会 化 学 习 的 工具 是 什么 ? 学 生 间 (以 及 师 生 ) 互动 的 
主要 手段 是 讨论 论坛 (discussion forum) 。 你 可 以 在 图 8-4 中 看 到 
一 张 论坛 快照 ， 人 们 通过 消息 序列 交流 ， 其 中 每 条 “消息 ”是 一 张 帖子 
或 对 其 的 评论 。 消 息 由 学 生 写 的 文本 组 成 。 一 系列 帖子 (及 其 评论 ) 


将 
集 


包含 在 一 个 更 大 的 线程 (thread) 中 ， 整 个 论坛 就 是 这 样 的 线程 
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oO 


Thread 
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i 
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图 8-4 
注 : 一 个 但 课 的 讨论 论坛 通常 被 分 解 成 一 系列 线程 〈 左 ) 。 在 每 个 线程 中 是 一 系列 帖子 ， 每 
个 帖子 可 能 有 评论 回应 ( 
学 生 如 何 使 用 论坛 ? 让 我 们 回 到 鲍 动 的 问题 。 他 可 以 先 检 查 ， 看 
是 否 有 人 已 经 在 论坛 上 发 帖 问 同样 的 问题 ， 或 者 一 个 很 类 似 的 问题 ， 
或 者 问题 的 答案 也 可 以 。 他 可 以 通过 输入 问题 的 类 似 语句 进入 搜索 
栏 ， 或 通过 手动 浏览 论坛 来 寻找 相似 问题 。 


如 果 鲍 动 确实 找到 了 一 个 已 经 在 问 他 的 问题 的 帖子 呢 ? 那 他 可 以 
看 到 评论 或 其 他 帖子 中 是 否 有 答案 。 如 采 有 答案 的 话 ， 假 如 答案 好 ， 
那么 他 可 以 侈 成 该 答案 ;假如 答案 不 好 ， 那 么 他 可 以 反对 该 答案 ， 以 
此 给 予 有 反馈 。 如果 还 没有 回答 ， 那 么 他 可 以 赞成 这 个 问题 ， 以 便 其 他 
人 注意 到 ， 并 尽快 回答 。 


如 果 他 找 不 到 这 样 的 帖子 怎么 办 ? 那 他 可 以 看 看 是 否 有 类 似 线程 
的 讨论 ， 并 发 布 一 个 新 的 帖子 。 如 采 他 没有 发 现任 何 接 近 他 想 要 的 线 
程 ， 他 可 以 创建 一 个 有 适当 标题 的 全 新 线程 。 你 可 以 在 本 书 网 站 Q8.7 
部 分 找到 这 一 过 程 的 流程 图 。 


We 


社会 化 学 习 网 络 


基于 同伴 的 学 习 创 造 了 一 个 社会 化 学 习 网 络 (Social 
Learning Network) ， 简 称 SLN。 社 会 化 学 习 网 络 的 三 个 主要 特征 
都 包含 在 它 的 名 字 中 : 


“ 学习 是 发 生 的 过 程 ， 代 表 对 有 关 话 题 的 知识 获取 。 通 常情 况 
下 ， 它 可 以 分 解 成 一 组 构成 学 习 材料 的 主题 。 


“ 社会 化 学 习 依 赖 同 伴 间 的 互动 。 可 能 有 指定 的 教师 ， 但 如 采 
没有 个 别 学 习 者 之 间 的 合作 ， 网 络 将 不 会 有 效 。 


， 同伴 间 的 社会 化 网 络 取 决 于 学 习 过 程 ， 进 而 义 影 啊 学 习 过 
程 。 


社会 化 学 习 网 络 对 如 何 实现 个 性 化 这 个 问题 给 出 了 有 趣 的 阐述 。 
相 比 依靠 教师 对 出 现 的 个 别 需求 做 出 回应 ， 我 们 可 以 在 社会 化 学 习 网 
络 内 部 搜索 解决 方案 。 学 习 过 程 变 得 可 扩展 ， 因为 更 多 的 学 生 应 该 会 
带 来 更 多 的 问题 和 更 多 的 潜在 问题 解答 者 ， 这 就 保持 了 两 者 之 间 的 平 
衡 。 你 可 以 在 图 8-5 中 看 到 这 个 想法 。 


图 8-5 
注 ， 当 教师 (中 心 节 点 ) 需要 应 对 课程 中 的 所 有 需求 时 


左 ) ， 学 习 过 程 是 不 可 扩展 的 。 社 
) 


( 
会 化 学 习 网 络 的 前 提 是 ， 学 习 者 自己 也 可 以 成 为 教师 〈 右 


类 似 于 网 飞 获 取 用 户 电影 评级 和 亚马逊 收集 顾客 对 产品 评论 的 方 
法 ， 募 课 平 台 可 以 在 学 生 学 习 课程 时 记录 数据 。 这 些 数据 包括 他 们 之 
间 如 何 互动 〈 例 如 通过 讨论 论坛 中 发 布 的 帖子 、 评 论 和 投票 ) ， 以 及 
他 们 如 何 消化 课程 内 容 (例如 通过 他 们 在 观看 讲座 视频 时 点 击 的 顺 
序 ) 。 最 终 ， 问 题 就 变 成 如 何 分 析 和 利用 这 些 数据 。 


社会 化 学 习 网 络 在 哪里 ? 


到 目前 为 止 ， 我 们 已 经 讨论 了 在 线 教育 背景 下 的 社会 化 学 习 网 络 
和 莫 课 。 我 们 还 能 在 哪里 找到 这 些 网 络 ? 社会 化 学 习 网 络 存 在 于 任何 
社会 化 学 习 发 生 的 情况 中 。 以 翻转 课堂 (flipped classroom) 为 
例 ， 观 看 通常 在 课堂 上 讲授 的 讲座 成 为 作业 的 一 部 分 ， 而 上 课时 间 则 
用 来 讨论 和 互动 。 当 教育 技术 和 这 些 课程 结合 起 来 部 署 ， 就 可 以 收集 
关于 社会 化 学 习 网 络 的 数据 。 


相关 应 用 也 存在 于 教育 之 外 。 除 了 教室 里 的 学 生 ， 还 可 以 考虑 公 
司 雇员 的 情况 。 当 员工 刚 被 雇用 时 ， 他 们 通 冲 要 经 历 一 个 入 职 过 程 ， 
学 习 完 成 工作 所 需 的 额外 材料 和 技能 。 在 职业 生涯 中 ， 他 们 还 经 芝 参 
加 企业 培训 课程 。 为 了 促进 这 类 培训 和 其 他 情况 下 的 社会 化 学 习 ， 公 
司 通常 建立 企业 社会 网 络 (enterprise social network) 平台 ， 如 
Jive 和 Yammer ° 


最 后 ， 考 虑 问答 网 站 [Question and Answer (Q&A) sitesj 
的 情况 ， 如 Quora、 和 雅虎 Answers 和 Stack Overflow。 问答 网 站 在 功能 
类 似 于 在 线 课程 的 论坛 ， 它 在 提问 和 回答 者 中 创建 社会 化 学 习 网 络 。 
它们 也 实施 激励 措施 ， 鼓 励 建 设 性 的 参与 ， 用 户 收 到 提问 或 回答 点 沈 
时 可 获得 积分 。 


在 本 章 的 其 余部 分 ， 我 们 将 概述 这 些 网 络 的 重要 人 研究 领域 。 这 有 征 
把 写本 书 时 的 一 个 最 新 主题 ， 你 会 看 到 许多 有 趣 而 尚未 解答 的 问题 ， 


它们 将 激励 后 续 人 研究 。 同 样 重要 的 是 ， 你 会 看 到 将 不 同 关系 可 视 化 的 
构建 网 络 的 例子 。 


将 社会 化 学 习 网 络 有 歼 可 视 化 


想象 一 个 论坛 中 的 一 系列 讨论 ， 如 图 8-4 所 示 。 关 于 社会 化 学 习 网 
络 ， 我 们 可 以 获得 很 多 信息 。 谁 发 布 了 一 个 线程 ? 谁 做 出 回复 ? 帖子 
和 回复 的 内 容 是 什么 ? 凡 此 种 种 ， 不 一 而 足 。 我 们 如 何 根据 这 些 信息 
将 网 络 可 视 化 ? 我 们 不 能 把 所 有 数据 放 在 一 张 角 中 ， 因 为 那样 会 太 过 
刘 乱 和 复杂 ， 无 法 从 中 得 出 有 意义 的 见解 。 我 们 必须 仔细 思考 ， 摘 述 
哪些 信息 对 我 们 来 说 很 重要 。 


我 们 如 何 表示 网 络 ? 用 图 (如 第 5 章 的 网 络 图 ) 。 在 社会 化 学 习 网 
络 的 图 中 ， 我 们 应 该 把 什么 作为 节点 ? 链接 应 该 代表 什么 ?它们 应 该 
是 有 向 (从 一 个 节点 到 男 一 个 节点 ) 还 是 无 向 的 ? 它们 应 该 是 加 权 

(用 数字 给 每 个 链接 权重 ) 还 是 不 加 权 的 ? 


也 许 首先 应 该 问 一 个 更 基本 的 问题 。 相 比 我 们 目前 为 止 看 到 的 其 
他 类 型 网 络 《如 第 5 章 的 网 页 网 络 或 第 1 章 和 第 2 章 的 设备 网 络 ) ， 社 会 
化 学 习 网 络 有 什么 不 同 ? 一 方面 ， 社 会 化 学 习 网 络 是 一 种 人 与 人 之 间 
的 社会 化 网 络 ， 而 不 是 联网 设备 之 间 的 通信 网 络 ， 如 图 8-6 所 示 。 在 社 
会 化 学 习 网 络 中 ， 人 们 之 间 的 通信 媒介 可 能 仍然 是 互联 网 ， 但 在 这 种 
情况 下 ， 我 们 更 关心 什么 信息 锐 共 至 了 以 及 最 终 会 形成 什么 社会 关 
系 ， 而 不 是 信 息 如 何在 人 和 人 之 间 传 输 的 。 我 们 将 在 第 10 草 和 人 第 14 章 
讨论 其 他 类 型 的 社交 网 络 。 


社会 化 网 络 


通信 网 络 


图 8-6 


注 : 对 于 社会 化 网 络 ， 我 们 感 兴趣 的 是 人 与 人 之 间 的 互动 ， 而 在 研究 技术 网 络 时 ， 我 们 专注 
于 人 们 手中 的 设备 之 间 的 通信 和 渠道 


因此 ， 讨 论 的 图 应 摘 绘 信息 共 至 的 过 程 。 尽 管 如 此 ， 我 们 仍然 可 
以 选择 作为 节点 和 链接 的 许多 变化 形式 ， 可 视 化 中 的 
最 终 目标 。 


学 生 图 
对 于 市 点 最 明显 的 选择 ， 是 用 它们 来 表示 不 同 的 学 生 。 那 么 ， 两 


个 学 生 《如 爱丽 丝 和 鲍 勒 ) 之 间 的 连接 表示 什么 ? 它 应 该 代表 他 们 之 
间 如 何 分 至 信息 的 某 种 关系。 四 种 可 能 性 是 : 


a) 爱丽 丝 和 鲍 勃 是 否 一 起 参加 了 讨论 。 

爱丽 丝 和 鲍 艺 有 多 少 次 一 起 参加 了 讨论 。 
否 回 复 了 鲍 芝 的 帖子 ， 反 之 亦 然 。 
曾 多 少 次 回复 鲍 勃 的 帖子 ， 反 之 亦 然 。 
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这 些 表 述 之 间 的 差异 可 能 很 小 ， 但 它们 各 目 会 产生 不 同类 型 的 链 
接 。 在 每 一 种 情况 下 ， 这 些 链 接 是 有 辐 还 是 无 同 ， 加 权 还 是 不 加 权 ? 
你 可 以 在 图 8-7 中 看 到 这 些 不 同 的 类 型 。 


(a) (b) 
无 向 无 加 权 无 加 加 权 
3 
(c) 有 向 无 加 权 (d) “有 向 加 权 
O—® © 
We 
图 8-7 


注 : 链 路 性 能 的 四 种 不 同 排列 组 合 方式 ， 可 用 于 将 社会 化 学 习 表现 为 图 的 形式 


在 (a) 中 ， 我 们 得 到 一 个 无 向 的 无 加 权 图 : 如果 我 们 发 现 了 一 个 
爱丽 丝 和 鲍 勃 都 发 布 的 线程 ， 那 么 他 们 之 间 有 链接 。 在 (b) 中 ， 我 们 
使 用 一 个 共同 参与 (co-participation) 计数 来 增加 (a) 的 权重 ， 
得 到 一 个 无 癌 加 权 图 : 例如 ， 如 有 果 我 们 发 现 爱 丽 丝 和 鲍 动 都 在 三 个 线 
程 中 发 布 ， 那 么 他 们 之 间 的 链接 权重 是 3。 


(c) 与 (a) 不 同 ， 因 为 我 们 谈论 的 是 回复 。 如 果 鲍 勃 回 答 了 爱 
丽 丝 发 布 的 一 个 问题 ， 那 并 不 代表 爱丽 丝 回答 了 鲍 劲 发 布 的 一 个 问 
题 。 我 们 需要 用 箭头 来 表示 这 个 区 别 ， 所 以 我 们 得 到 一 个 有 回 无 加 权 
"在 《d) 中 ， 我 们 相 比 《c) 更 进一步 ， 开 始 计算 回复 的 数量 ， 这 
给 了 我 们 一 个 有 向 加 权 图 : 如果 鲍 动 回复 了 爱丽 丝 4 次 ， 而 爱丽 丝 回复 
了 鲍 勃 1 人 次， 那么 鲍 勃 对 爱丽 丝 的 链接 权重 为 4， 而 爱丽 丝 对 鲍 勃 的 链 
接 权 重 为 1。 


让 我 们 用 一 个 例子 ， 以 这 些 类 型 的 图 形 表示 图 8-8 中 的 〈 小 型 ) 讨 
论 论坛 。 有 4 个 学 生 ， 爱 丽 丝 、 鲍 动 、 查 理 和 达 娜 ， 都 在 不 同 程 度 上 参 
与 论坛 。 四 个 线程 中 的 每 一 个 都 已 经 发 布 了 不 同 数量 的 帖子 ， 线 程 I 有 


两 个 ， 线 程 I 有 两 个 ， 等 等 。 每 个 帖子 中 都 有 一 个 人 提问 (上 方 列 出 
的 名 字 ) ， 并 有 一 个 人 回答 (下 方 的 名 字 ) 。 (现实 中 ， 对 于 一 个 问 


题 ， 可 能 会 有 很 多 回复 ， 而 一 个 帖子 中 可 能 根本 就 没有 提出 问题 。) 
讨论 论坛 


线程 I 线程 I 线程 IV 


| .---- 提问 者 


ms 回答 者 


图 8-8 包含 4 个 线程 、4 个 学 生 和 8 个 节点 的 小 型 讨论 论坛 


对 于 每 个 图 形 类 型 ， 我 们 将 以 什么 作为 节点 ? 我 们 将 有 4 个 节点 ， 
每 个 学 生 就 是 一 个 。 那 么 链接 呢 ? 让 我 们 分 别 分 析 每 种 情况 ， 对 于 鲍 
勃 和 查理 而 言 


(a) 无 向 ,， 无 加 权 : 鲍 勃 和 查理 一 起 加 入 了 线程 吗 ? 是 的 ， 
他 们 都 加 入 了 线程 1 和 和 IV， 所 以 我 们 在 图 中 画 出 他 们 之 间 的 链接 。 

(b) 无 向 ， 加 权 : 鲍 勃 和 查理 共同 加 入 了 多 少 线程 ? 两 个 。 
所 以 他 们 的 链接 权重 是 2。 

(c) 有 向 ， 无 加 权 : 钱 勃 回复 了 查理 发 布 的 帖子 吗 ? 没有 。 
查理 回复 了 鲍 勃 发 布 的 帖子 吗 ? 是 的 ， 在 线程 IV 中 。 所 以 查理 连接 
至 鲍 勃 ， 但 鲍 勃 没有 连接 至 查理 。 

(d) 有 向 ， 加 权 : 鲍 勃 回复 了 查理 多 少 次 ? 零 次 。 查 理 回复 
了 鲍 勃 多 少 次 ? 一 次 。 所 以 从 查理 到 鲍 勃 的 链接 权重 为 1 。 


在 对 其 余 的 学 生 对 儿 做 这 样 的 操作 后 《我 们 鼓励 你 这 样 做 ! ) ， 
我 们 会 得 到 网 8-9 所 示 的 内 容 。 在 有 向 的 情况 下 (C 和 D) ， 爱 丽 丝 和 
鲍 勃 是 唯一 均 指 癌 对 方 的 一 对 。 爱 丽 丝 回 复 了 鲍 勃 两 次 《线程 H 和 I 中 
各 有 一 次 ) ， 而 鲍 勃 回复 了 爱丽 丝 三 次 〈 线 程 I、I 和 IV 中 各 有 一 
次 ) 。 


人 (b) 
无 回 无 加 权 无 问 加 权 


(c) (d) 
有 问 无 加 权 有 问 加 权 


图 8-9 用 四 种 图 形 类 型 表示 图 8-8 中 的 可 社会 化 学 习 网 络 


学 生 与 线程 图 、 线 程 与 线程 图 .…… 


使 用 学 生 作 为 节点 有 助 于 表示 网 络 中 的 “ 谁 ”( 即 哪些 学 生 在 互 
动 ) ， 但 它 并 不 能 解释 “什么 ”( 即 谈话 中 正在 讨论 的 话题 ) 。 这 也 是 
需要 描述 的 重要 信息 ， 因 为 它 可 以 说 明 ， 例 如 什么 话题 讨论 得 最 多 或 
容易 把 人 弄 糊 涂 。 


我 们 怎样 才能 发 现 关 键 话题 是 什么 ? 原始 讨论 文本 的 未 加 工 形式 
往往 太 长 ， 并 且 缺 乏 信息 。 我 们 可 以 做 的 ， 是 从 自然 语言 处 理 
(natural language processing) 中 采用 适当 的 方法 ， 提 取 基 于 文 
本 的 主题 。 一 个 主题 提取 的 输出 内 容 示 例如 图 8-10 所 示 。 我 们 得 到 一 
组 主题 ， 每 个 都 由 某 些 共同 出 现 的 关键 字 组 成 。 每 个 帖子 都 可 以 与 文 
本 中 包含 的 一 个 (或 多 个 ) 主题 相关 联 。 


图 8-10 从 论坛 中 提取 主题 时 可 得 出 信息 的 示例 


注 : 主题 由 共同 出 现 的 词汇 组 成 ， 每 个 帖子 都 与 其 最 突出 的 主题 相关 


我 们 皇 么 能 推 朵 ， 十 否 每 个 学 生 都 倾 癌 于 融 特 定 主题 提问 或 回答 
呢 ? 这 似乎 是 一 个 微不足道 的 问题 : 我 们 不 能 直接 检查 学 生 关 于 一 个 
主题 的 帖子 是 否 包含 问号 吗 ? 不 笠 的 是 ， 这 没 那么 容易 ， 因 为 有 很 多 
反例 ， 如 提问 时 不 使 用 问号 (例如 “请 给 我 解释 这 是 如 何 工作 的 ”) ， 
以 问题 的 形式 提供 答案 (例如 “你 会 认为 它们 是 不 同 的 ， 对 吧 ? ”) ， 
或 干脆 没有 使 用 正确 的 标点 。 


主题 提取 和 问题 检测 都 是 信息 检索 (information retrieval) 
领域 的 研究 热点 。 请 放心 ， 这 些 功能 的 高 质量 处 理 现在 已 经 存在 。 我 


们 将 假设 (i) 每 个 线程 独特 到 足以 表示 一 个 单独 的 话题 ; (ii) 我 们 
已 经 准确 地 确定 哪些 帖子 〈 评 论 ) 是 问题 ， 哪 些 是 答案 。 


我 们 如 何 体现 学 生 与 主题 之 间 的 关系 ? 我 们 可 以 将 视觉 效果 与 另 
一 种 节点 结合 ， 每 个 话题 一 个 节点 ， 而 不 仅仅 是 描绘 图 中 的 学 生 。 回 
到 图 8-8 中 的 例子 ， 我 们 将 最 终 得 到 如 图 8-11 所 示 的 结 采 。 在 这 里 ， 学 
生 市 点 在 顶部 ， 主 题 《线程 ) 万 点 在 底部 ， 每 个 链接 表示 学 生 加 入 主 
题 的 次 数 。 
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图 8-11 图 8-8 中 论坛 作为 连接 学 生 和 主题 的 偶 图 显示 

图 8-11 是 一 个 偶 图 (bipartite graph) : 它 有 两 组 独立 的 节点 
(这 里 是 学 生 和 主题 ) ， 每 个 链接 联系 一 组 中 的 一 个 节点 〈 即 一 个 学 
生 ) 和 男 一 组 中 的 一 个 节点 ( 即 一 个 主题 。 这 个 图 是 加 权 的 ， 但 是 
如 果 我 们 只 是 对 学 生 是 否 讨论 了 一 个 话题 感 兴趣 ， 我 们 可 以 把 权重 从 
链接 中 移 除 ， 得 到 一 个 无 加 权 偶 图 。 


在 这 张 图 里 ， 我 们 能 获得 许多 有 用 的 信息 。 我 们 可 以 看 到 ， 每 个 
学 生 讨 论 了 哪些 主题 ， 每 个 主题 有 哪些 学 生 讨 论 ， 以 及 其 被 讨论 的 频 
率 。 它 没有 揭示 的 一 点 是 每 个 学 生 的 帖子 的 性 质 ， 它们 是 问题 还 是 答 
案 ? 例如 ， 我 们 可 以 看 到 ， 鲍 靳 参与 了 每 一 个 主题 ， 共 有 7 个 帖子 ， 但 
我 们 只 有 回 到 图 8-8 才 能 知道 ， 提 问 和 回答 之 间 的 比例 大 致 是 1:1 (前 


者 有 3 个 ， 后 者 有 4 个 ) 。 在 寻找 网 络 的 简洁 表现 形式 时 ， 细 节 损 失 是 
我 们 付出 的 代价 。 


男 一 方面 ， 根 据 我 们 所 寻找 的 见解 ， 图 8-11 可 能 包含 太 多 与 天 键 
言 尽 无 天 的 信息 。 如 果 我 们 想 知 道 两 个 学 生 在 所 讨论 的 话题 上 多 么 “ 相 
似 *”， 或 是 两 个 主题 对 于 参与 的 学 生来 说 多 么 “相似 * 呢 ?解决 这 些 问题 
的 一 种 方法 是 利用 偶 图 中 的 共同 参与 计数 。 对 于 学 生 ， 我 们 考虑 每 对 
学 生 ， 统 计 两 人 都 发 帖 的 线程 数量 。 以 鲍 劳 和 达 娜 为 例 : 线程 II 是 他 
们 唯一 都 发 帖 的 地 方 ， 因 此 他 们 的 共同 参与 值 为 1。 对 于 线程 ， 我 们 也 
考虑 每 一 对 ， 统 计 在 两 个 线程 中 都 发 帖 的 学 生 人 数 。 以 线程 I 和 TV 为 
例 : 爱丽 丝 和 鲍 动 都 在 这 两 个 线程 中 发 帖 ， 所 以 他 们 的 共同 参与 值 是 


对 其 他 每 一 对 重复 这 一 步 台 ， 会 得 到 图 8-12 中 的 图 。 在 这 里 更 容 
易 看 到 ， 例 如 ， 线 程 I 和 IV 有 三 个 学 生发 了 相同 的 帖 ， 但 我 们 再 也 看 不 
到 哪 三 个 学 生 在 I 和 IV 中 都 发 帖 。 为 此 ， 我 们 必须 回 到 侦 图 ， 才 能 看 到 
他 们 是 爱丽 丝 、 鲍 邯 和 查理 。 这 个 学 生 到 学 生 的 网 络 和 图 8-9 中 的 有 同 
无 加 权 图 一 样 ， 因 为 在 每 一 种 情况 下 ， 我 们 都 是 使 用 共同 参与 值 。 


图 8-12 图 8-11 偶 图 中 获得 的 学 生 到 学 生 ( 左 ) 和 线程 到 线程 ( 右 ) 的 共同 参与 图 


将 偶 图 划分 为 两 个 独立 的 图 形 ， 每 个 节点 集 一 张 图 ， 这 称 为 网 络 
投影 (network projection) 。 根 据 投影 用 来 得 出 成 果 图 中 节点 之 
间 的 权重 的 规则 ， 可 以 区 分 不 同 的 投影 类 型 。 这 里 所 采取 的 类 型 称 为 
简单 加 权 ， 其 中 偶 图 的 各 个 链接 加 权 相 等 。 


对 社会 化 学 习 网 络 研 究 进行 测试 


现在 我 们 已 经 了 解 了 一 些 类 型 的 图 表 ， 这 些 图 表 可 以 用 来 表示 社 
会 化 学 习 网 络 的 不 同方 面 。 但 古 我 们 使 用 的 例子 中 的 网 络 规 模 ， 比 真 
正 莫 课 论坛 看 到 的 要 小 几 个 量 级 。 这 些 图 表 在 实践 中 效果 如 何 ? 


现实 生活 中 的 社会 化 学 习 网 络 


我 们 将 看 一 看 我 们 目 己 的 一 门 莫 课 的 讨论 示意 图 。 在 图 8-13 中 ， 
我 们 使 用 无 同 、 无 加 权 、 学 生 - 学 生 的 方法 ， 使 社会 化 学 习 网 络 实现 可 
视 化 。 


未 过 滤 的 边缘 更 有 用 的 表现 形式 
图 8-13 一 门 幕 课 课程 的 学 生 的 社会 化 学 习 网 络 


先 看 看 左边 的 图 。 两 个 学 生 之 间 的 链接 表明 他 们 至 少 参 与 了 一 个 
线程 。 虽 然 图 可 能 很 闫 观 , 但 要 从 中 得 出 任何 有 意义 的 结论 相当 
难 ， 因 为 节点 和 链接 的 数量 太 大 。 男 外 ， 我 们 只 显示 了 在 论坛 发 帖 不 
止 一 次 的 713 名 学 生 ， 人 否则 ， 这 张 图 将 更 大 。 


要 发 现 关 于 社会 化 学 习 网 络 的 有 用 信息 ， 我 们 需要 “清理 ”这 一 图 
像 。 有 什么 可 行 的 方法 能 做 到 这 一 点 ? 想 想 我 们 可 以 如 何 利用 线程 共 
同 参与 计数 。 在 左边 ， 如 果 两 个 学 生 曾 经 共同 参与 线程 ， 我 们 会 将 他 
们 连接 起 来 ， 要 是 将 连接 所 需 的 共同 参与 值 提 到 更 高 水 平 呢 ? 这 将 移 
除 图 中 较 弱 的 连接 ， 使 我 们 能 够 找到 参与 程度 最 高 的 配对 。 在 右边 的 
图 8-13 中 ， 你 可 以 看 到 ， 将 连接 阔 值 设置 为 3 时 的 效果 。 现 在 我 们 可 以 
清楚 地 识别 ， 经 常 共同 参与 (至 少 成 对 ) 的 学 生 群 体 。 这 是 一 个 非常 
简单 的 例子 ， 它 能 说 明 社 会 网 络 中 社团 发 现 (community 
detection) 的 出 发 点 。 


人 们 应 该 明白 ， 在 莫 课 中 的 社会 化 学 习 网 络 遵循 这 个 结构 。 庞 大 
的 规模 使 得 学 生 很 难 与 很 多 同伴 建立 联系 ， 即 使 是 在 共同 参与 的 同伴 
中 ， 有 异步 的 交流 形式 也 使 他 们 难以 维持 牢固 的 联系 。 


帮助 老师 与 帮助 学 生 


研究 社会 化 学 习 网 络 的 一 个 最 终 目 标 ， 是 找到 更 有 效 的 教学 方式 
和 学 习 方 式 。 如 果 老 师 获 得 了 这 里 讨论 的 图 像 类 型 ， 他 们 能 更 有 效 地 
完成 哪些 任务 ? 


一 方面 ， 这 些 图 表 可 以 帮助 教师 识别 学 习 过 程 中 有 困难 的 学 生 。 
那些 常常 问 许多 问题 的 人 很 可 能 没有 从 内 容 中 得 到 理想 的 学 习 体验 。 
在 这 个 类 别 中 的 学 生 ， 在 (加 权 、 定 向 的 ) 学 生 - 学 生 图 中 也 有 低 入 
度 ， 他 们 很 可 能 真 的 想 学 习 内 容 ， 但 没有 从 同伴 那里 得 到 所 需 的 帮助 

(如 图 8-14 中 的 学 生 C) 。 这 些 学 生 可 能 会 从 直接 指导 介入 中 获 益 不 


少 。 


图 8-14 
学 生 图 ， 找 到 社会 化 学 习 网 络 图 中 的 学 习 困 难 者 和 专家 


rT 


注 : 教师 可 利用 学 生 


男 一 方面 ， 教 师 也 可 以 通过 这 些 图 像 识别 “学 生 老 师 ”。 正确 回答 
问题 的 学 生 不 仅 十 分 了 解 学 习 材 料 ， 而 且 愿 意 帮助 不 慌 的 学 生 。 在 学 
生 -学 生 图 中 有 高 出 度 和 高 “重要 性 ”如 第 5 章 根据 网 页 级 别 的 定义 ) 
的 人 可 能 属于 这 个 类 别 〈 例 如 图 8-14 中 突出 显示 的 节点 ) 。 老 师 可 以 
要 求 这 些 学 生 帮 助 一 些 学 习 有 困难 的 学 生 。 


这 些 图 像 还 可 以 帮助 老师 确定 ， 哪 些 课 程 主题 受到 学 生 最 多 (或 
最 少 ) 的 关注 。 老 师 可 能 会 想 把 自己 的 注意 力 集中 在 这 些 话题 上 。 学 
生 - 线 程 偶 图 可 以 帮助 识别 这 些 ， 例 如 通过 确定 上 度数 最 高 的 线程 来 实 
现 。 


除了 回 老 师 显示 图 像 效 果 ， 帮 助 他 们 得 出 结论， 会 有 一 些 发 现 目 
动产 生 吗 ? 尤其 古 那 些 一 开始 就 更 容易 被 状 能 机 器 识别 的 发 现 。 例 
如 ， 积 极 研 究 算法 ， 在 课程 早期 进行 预测 ， 看 看 学 生 以 当前 的 学 习 进 
度 ， 最 终 将 会 有 怎 样 的 学 习 成 末 。 这 些 算 法 中 ， 有 些 使 用 我 们 在 第 7 对 
看 到 的 协同 过 滤 ， 只 不 过 它 不 是 预测 用 户 对 电影 的 评级 ， 其 目的 是 预 
测 学 生 在 测验 、 在 学 生 论 坛 中 ， 参 与 随 着 时 间 推 移 的 变化 或 其 他 相关 
输出 的 表现 。 


最 近 ， 关 于 这 个 话题 的 有 趣 发 现 是 ， 学 生 行为 的 某 些 特征 ， 特 别 
征 学 生 行为 的 特定 顺序 ， 及 其 观看 讲座 视频 时 访问 的 地 点 ， 可 以 预测 
其 会 在 测验 和 考试 中 取得 的 成 绩 。 例 如 ， 最 近 的 研究 表明 ， 完 全 基于 
学 生 在 观看 视频 时 所 展示 的 行为 ， 预 测 其 能 否 正确 回答 问题 ， 可 能 达 
到 70%~80% 的 正确 率 。 如 有 果 在 课程 开始 时 ， 计 算 机 就 标记 出 那些 预测 
成 绩 不 好 的 学 生 ， 那 么 老师 就 会 及 时 知道 应 该 帮助 谁 。 考 虑 到 最 终 未 
能 完成 一 门 蔡 课 课程 的 人 数 比 例 ， 将 正确 率 提 高 1%， 束 相当 于 提前 正 
确 识别 几 十 个 学 生 。 


可 视 化 、 推 荐 和 预测 只 是 三 种 社会 化 学 习 网 络 。 最 后 ， 请 记 住 ， 
社会 化 学 习 网 络 的 效果 取决 于 一 个 概念 : 学 生发 布 问题 将 促使 同伴 给 
出 准确 答案 。 社 会 化 学 习 网 络 的 可 持续 性 的 前 担 ， 和 是 布 望 通过 大 量 学 
习 者 的 页 献 和 参与 的 融合 ， 使 学 生 的 需求 可 以 从 内 部 得 到 部 分 满足 。 


AS 一 A 
7 
> 十 
总 结 


— 


在 本 书 的 这 一 部 分 ， 我 们 探讨 了 三 种 网 络 活动 : 产品 评级 、 扒 
荐 电影 和 社会 化 学 习 。 这 些 应 用 方式 看 似 多 样 ， 但 每 一 个 都 依赖 于 
群众 智慧 的 某 种 变化 形式 ， 随 着 关于 某 些 事实 的 更 多 意见 或 知识 被 
收集 ， 在 适当 的 情况 下 ， 我 们 可 以 对 真实 情况 做 出 更 高 质量 的 估 
计 。 


在 第 6 划 中 ， 我 们 看 到 ， 群 众 智慧 是 一 个 有 效 的 工具 ， 它 能 根据 
一 组 用 户 评级 对 “地 面 实 况 ” 做 出 准确 估计 。 当 单个 样本 的 规模 不 够 
大 时 ， 可 以 使 用 贝 叶 斯 调整 等 技术 ， 将 其 与 更 多 人 口 进 行 比较 。 我 
们 在 讨论 亚马逊 产品 排名 育 后 的 一 些 原 则 时 ， 介 绍 了 这 些 工 具 ， 不 
过 它们 从 评级 到 排名 的 实际 公式 仍然 是 秘密 。 


然后 我 们 转 辐 第 7 革 中 的 推荐 问题 。 我 们 看 到 网 飞 如何 通 过 “ 读 
心术 ”游戏 ， 使 用 网 飞 已 收集 并 存储 在 数据 库 中 的 历史 电影 评级 ， 来 
预测 未 知 的 用 户 电影 评级 。 我 们 探讨 了 网 飞 根据 特定 用 户 和 电影 历 
史 形 成 基线 育 后 的 概念 ， 随 后 根据 不 同 用 户 或 不 同 电影 之 间 的 相似 
之 处 进行 调整 。 

最 后 ， 在 第 8 章 ， 我 们 探讨 了 社会 化 学 习 网 络 ， 这 有 是 学 生 之 间 在 
教育 话题 上 合作 形成 的 社会 化 网 络 类 型 。 我 们 讨论 了 蒙 课 和 当前 的 
人 研究， 以 表示 、 分析 并 利用 在 这 些 场景 中 出 现 的 社会 化 学 习 网 络 。 
社会 化 学 习 网 络 的 核心 古 布 望 学 生 群 体 可 以 合作 ， 解 决 彼此 的 问 


题 。 


第 四 部 分 
大 众 并 不 那么 驰 明 


我 们 了 解 了 群众 的 留 茵 ， 这 一 概念 表示 ， 相 比 个 人 决策 ， 从 大 
量 人 群 中 汇集 信息 往往 会 形成 更 好 的 决策 。 这 一 概念 假设 每 个 人 的 
观点 都 是 独立 的 。 它 们 在 什么 情况 下 不 是 独立 的 ? 当 它 们 不 独立 时 
区 和 和 


事实 上 ， 在 许多 情况 下 ， 别 人 的 想法 会 影响 你 的 行为 。 束 像 你 
看 某 个 YouTube 视 频 ， 征 因为 大 家 都 在 谈论 它 。 你 买 了 笠 果 平板 电 
脑 ， 是 因为 其 他 人 都 有 。 你 为 作业 问题 写 上 某 个 答案 ， 是 因为 你 的 


同学 坚持 认为 它 是 正确 的 。 此 外 ， 你 看 到 采取 这 种 行动 的 人 越 多 ， 
你 束 越 可 能 受到 驱使 来 做 同样 的 事情 。 

鉴于 这 种 行为 ， 我 们 在 本 书 这 一 部 分 的 重点 是 社会 网 络 中 意见 
的 依赖 性 。 在 第 9 章 ， 我 们 将 了 解 病毒 式 传播 ， 在 第 10 章 ， 我 们 将 讨 
论 社 会 影响 。 在 这 一 部 分 的 最 后 ， 你 可 能 会 相信 ， 在 某 些 情 况 下 ， 
影响 大 众 实 际 上 是 相对 容易 的 。 


第 9 章 
让 视频 短片 变 成 “病毒 ” 


在 用 户 生成 视频 内 容 的 领域 ，YouTube ( 见 图 9-1) 是 占 主导 地 位 
的 分 译 网 站 。 浏 览 它 的 视频 列表 ， 我 们 可 以 找到 的 视频 包括 精彩 的 体 
育 赛事 短片 、 目 请 为 YouTube 亏 术 家 的 首 乐 ， 以 及 教育 专题 讲座 。 到 
2015 年 ，YouTube 上 每 天 有 数 亿 小 时 的 视频 被 收看 。 


You( ly 


图 9-1 YouTube 商 标 标识 


在 关于 YouTube 的 描述 中 ， 你 可 能 听 过 病毒 式 传播 (vira- 
lization) 这 个 术语 。 你 可 能 想 知道 ， 视 频 短 片 怎样 才能 实现 病毒 式 
传播 ? 我 们 将 在 本 章 解 释 这 个 问题 。 与 此 同时 ， 我 们 会 认识 到 ， 
YouTube 视 频 浏览 是 一 个 通过 信息 传播 创造 依赖 关系 的 好 例子 。 


YouTube 和 病毒 式 传 播 


在 进入 病毒 式 传播 的 讨论 前 ， 让 我 们 看 一 看 YouTube 的 演变 。 该 
公司 于 2005 年 2 月 由 三 名 PayPal 前 员工 创立 。 自 成 立 以 来 ， 该 网 站 的 增 
长 速度 非常 快 : 到 2006 年 7 月 ， 它 每 天 新 增 65 000 个 视频 和 1 亿 次 的 访 
问 量 。 几 个 月 后 ， 在 2006 年 11 月 ， 该 公司 被 谷歌 以 16.5 亿 美元 收购 。 


在 短 短 几 年 之 内 ， 由 于 很 多 人 经 常 在 YouTube 上 看 视频 ， 这 让 该 
网 站 成 为 一 个 搜索 引擎， 它 的 规模 仅 次 于 谷歌 本 号。YouTube 的 日 均 
视频 观看 数 增长 情况 如 图 9-2 所 示 。2009 年 10 月 ， 该 数字 达到 10 亿 ; 到 
2012 年 1 月 ， 该 数字 增加 了 4 倍 。 如 果 你 曾经 体验 过 网 站 上 使 人 上 交 的 
推荐 栏 ， 你 承 不 会 对 这 种 增长 势头 感到 惊讶 ， 因 为 它 会 连续 不 断 地 将 
相关 短片 推荐 给 观众 ， 你 一 次 要 看 上 几 个 小 时 才 会 退出 。 
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入 入 ^ 
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图 9-2 


注 : 2009 年 到 2012 年 中 有 4 个 月 ，YouTube 的 日 均 视频 浏览 数 突破 新 的 10 亿 大 关 。 截 至 2016 年 7 
月 ， 这 一 数字 已 达到 近 50 亿 


到 2016 年 年 中 ， 每 天 有 超过 10 亿 人 访问 YouTube， 这 带 来 了 近 50 
亿 的 视频 浏览 量 。 平 均 每 分 钟 有 400 小 时 的 新 内 容 被 上 传 到 YouTube， 
每 天 有 长 达 近 66 年 的 新 内 容 。 ( 换 句 话说 ， 如 果 你 收集 了 未 来 24 小 时 
内 上 传 的 所 有 视频 ， 你 要 花 66 年 才能 看 完 它们 ! ) YouTube 已 经 成 为 
一 种 病毒 式 现象 ， 这 和 该 网 站 上 的 视频 短片 的 目标 一 致 。 


病毒 式 风格 


征 什 么 让 视频 实现 病毒 式 传播 ? 这 个 问题 没有 一 个 简单 的 答案 ， 
但 这 并 不 能 阻止 人 们 研究 它 。 


在 本 书 第 三 部 分 ， 我 们 讨论 了 网 站 如 何 捕获 和 存储 用 户 在 网 站 上 
的 行为 。YouTube 也 不 例外 : 它 可 以 记录 用 户 行为 ， 包 括 与 视频 播放 
器 的 交互 。 这 些 数据 可 以 用 来 分 析 ， 以 了 解 人 们 如 何 观看 视频 ， 以 及 
哪些 视频 会 出 现 病毒 式 传 播 。 一 些 被 YouTube 用 来 强调 整体 观看 行为 
的 分 析 工 具 ， 如 YouTube Insight， 已 同 公 众 开 放 使 用 。 


最 “具名 昭著 ”的 病毒 式 传播 视频 是 什么 ?” 是 《江南 style》。 它 是 
由 歌手 PSY ( 乌 上 开 ) 演唱 的 4 分 钟 音乐 视频 ， 于 2012 年 7 月 发 布 。《 江 
南 style》 成 为 第 一 个 浏览 量 突破 10 亿 的 视频 ， 它 在 短 短 5 个 月 (到 2012 
年 12 月 ) 内 达到 该 数字 。 在 不 到 2 年 的 时 间 里 ， 这 一 数字 达到 了 20 亿 
(到 2014 年 5 月 ) 。 其 浏 贤 量 随 着 时 间 变 化 的 示意 图 由 YouTube 提 供 ， 
如 图 9-3 所 示 。 


自 2013 年 以 来 ， 另 外 12 个 YouTube 视 频 的 浏览 量 也 突破 了 10 亿 大 
关 。 和 规 至 2016 年 年 初 ， 浏 贤 量 仅 次 于 《江南 style》 的 是 泰勒 .斯 威夫 特 
的 《空白 区 》 (Blank Space) ， 它 获得 13 亿 浏览 量 。 但 直到 本 书写 作 
时 ，《 江 南 style》 仍 是 唯一 达到 20 亿 浏览 量 的 视频 。 事 实 上 ， 当 它 于 
2014 年 12 月 达到 2 147 483 647 的 浏览 量 后 ，YouTube 似 乎 区 已 经 无 法 计 
算 浏 览 量 了 ， 显 示 在 主页 的 数字 也 因此 夏 然 而 止 。 


(浏览 量 ) 

2 500 000 000 
2 000 000 000 
1 500 000 000 
1 000 000 000 
500 000 000 
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2013 年 1 月 ” 2013 年 7 月 2014 年 1 月 ” 2014 年 7 月 ”2015 年 1 月 ” ”2015 年 7 月 


图 9-3 
注 : PSY 演 唱 的 《江南 style》 音 乐 视 频 在 YouTube 上 的 累计 浏览 量 随时 间 变 化 的 曲线 


为 什么 YouTube 计 数 会 停止 在 这 看 似 随机 的 数字 上 ? 其 实 这 是 使 
用 32 位 可 以 存储 的 最 大 数字 ， 是 YouTube 为 每 个 视频 计数 器 预 留 的 数 
量 。 没 有 人 预料 到 ， 一 个 视频 会 累积 达到 这 么 多 浏览 量 ， 以 至 于 32 位 
存储 都 不 够 。YouTube 迅 速 修 复 这 个 问题 ， 升 级 到 64 位 计数 器 ， 将 最 
大 值 提 高 至 9 223 372 036 854 775 808。 所 以 ， 在 PSY、 斯 威夫 特 或 其 
他 人 的 视频 浏览 量 达到 100 万 的 三 次 方 之 前 ，YouTube 的 计数 器 应 该 是 
全 


把 观众 带 给 视频 


像 《 江 南 style》 这 样 的 视频 怎么 会 如 此 受 欢 迎 呢 ? 要 回答 这 个 问 
题 ， 我 们 首先 可 以 看 看 引导 观众 点 击 YouTube 短 片 的 四 个 主要 途径 : 


。 在 合 歌 等 网 站 上 ， 搜 索 包含 视频 标签 的 词组 ; 

“介绍 (例如 来 自 电子 邮 件 、 脸 书 或 推广 视频 的 广告 ); 
“订阅 的 YouTube 频 道 发 布 该 视频 ; 

。 YouTube 边 栏 给 出 的 视频 推荐 。 


相 比 视频 的 “ 赞 > 和 * 踩 ”的 数量 ， 订 阅 和 推荐 对 决定 视频 受 欢 迎 程 
度 往往 起 到 更 大 的 作用 。 订 阅 很 们 单 易 届 ， 但 YouTube 如 何 产 生 推 荐 
内 容 ? 它 使 用 的 古 像 网 飞 推荐 电影 那样 的 协同 过 滤 算 法 ， 还 是 将 视频 
片段 按 “ 重 要 性 ”排名 的 网 页 级 别 式 的 算法 ? 


事实 证 明 ， 这 两 种 算法 在 该 应 用 上 都 转化 得 不 好 。 不 同 于 网 飞 的 

影 ，YouTube 视 频 的 长 度 和 生命 周期 通常 很 短 ， 并 且 观 看 行为 变化 

大 ， 很 难 建立 用 户 评级 视频 片段 的 持续 系统 。 对 于 网 页 级 别 算法 ， 我 

们 需要 将 视频 片段 以 某 种 方式 < 连接” 在 一 起 〈 例 如 ， 通 过 搜索 视频 描 

述 ， 找 到 其 他 片段 的 超 链接 ， 或 比较 不 同 视 频 的 标签 ， 找 到 匹配 关键 
词 ) 。 但 是 标签 和 描述 的 质量 是 相当 不 可 靠 的 。 


YouTube 视 频 推 荐 被 认为 是 不 同 的 ， 也 要 简单 得 多 。 还 记得 ， 在 
第 8 章 ， 我 们 利用 学 生 在 讨论 线程 中 的 共同 参与 值 ， 对 学 生 之 间 的 链接 
进行 加 权 ， 也 利用 学 生 之 间 的 链接 ， 对 学 生 在 讨论 线程 中 的 共同 参与 
值 进行 加 权 吗 ? YouTube 记 录 视 频 对 儿 的 共同 访问 计数 〈co- 
visitation count) ， 它 代表 某 个 最 近 的 时 间 窗 (如 过 去 24 小 时 ) 中 ， 
两 个 视频 被 同一 观众 观看 的 次 数 。 因 此 ， 如 果 在 过 去 的 某 一 天 ， 有 100 
人 观看 了 A 和 B 两 个 视频 ， 我 们 可 以 用 权重 100 连 接 A 和 B。 通 过 这 种 方 
法 ， 我 们 可 以 构建 一 个 加 权 的 视频 -视频 图 。 你 可 以 在 图 9-4 中 看 到 一 
个 示例 。 


YouTube 似 乎 采用 这 种 共同 访问 图 ， 并 将 其 与 视频 标题 、 标 签 和 
摘要 中 的 关键 词 匹 配 结 合 ， 生 成 给 你 的 推荐 。 人 们 也 注意 到 ， 往 往 只 
有 那些 观看 计数 与 当前 视频 接近 或 略 高 的 视频 才 会 显示 在 推荐 页 面 。 
这 使 得 被 广泛 观看 的 视频 更 容易 广泛 传播 : 这 是 一 个 正 反 馈 ! 


〇 = 视频 
@ 〇 = 两 个 视频 均 被 0 人 观看 


图 9-4 YouTube 推 荐 利用 视频 之 间 的 共同 访问 计数 
注 : 图 中 每 个 节点 都 是 一 个 视频 ， 链 接 的 权重 是 在 一 定时 间 内 观看 了 这 两 个 视频 的 人 数 


定义 病毒 式 传播 
病毒 式 传播 到 底 是 什么 意思 ? 虽然 没有 普 电 接受 的 定义 ， 但 它 通 
常 表示 ， 视 频 的 总 浏览 量 随时 间 变 化 的 趋势 ， 如 图 9-5 中 的 曲线 


wf | Lua 好 三 
总 浏 yu 三 


y = 了 上 1 
迅速 开始 快速 增长 时 间 
快速 增长 持续 时 间 长 


图 9-5 视频 总 浏览 量 随时 间 变化 的 典型 趋势 
注 ， 视 频 (a) 保持 在 低 水 平 。 视 频 (b) 迅速 上 升 ， 但 随后 迅速 放 缓 。 视 频 (c) 在 长 时 间 内 
增长 较 快 ， 并 保持 一 段 时 间 

1. 总 浏览 计数 高 ; 

2. 持续 足够 时 间 的 迅速 增长 ; 

3. (有 了 时) 短 时 间 后 开始 快速 增长 。 


没有 黄金 公式 可 以 让 你 遵循 ， 以 确保 你 的 视频 将 实现 病毒 式 传 
播 。 不 过 , 已 建立 的 信息 传播 (information spread) 模型 可 以 就 
病毒 式 传播 发 生 的 原因 带 来 有 趣 的 见解 。 这 些 理想 化 的 模型 已 经 被 用 
来 分 析 “ 项 目 ”( 范 围 从 实体 产品 到 疾病 ) 在 人 群 中 的 传播 。 把 YouTube 
视频 看 成 项 目 ， 我 们 将 很 快 看 到 本 章 中 一 个 简单 但 有 启发 性 的 信息 传 
播 模型 。 


受 欢迎 程度 


让 我 们 先 考虑 吸引 人 们 选择 某 个 项 目的 因素 。 其 中 之 一 当然 是 该 
项 目 带 给 人 的 内 在 价值 (intrinsic value) 。 有 些 人 可 能 喜欢 它 ， 
不 管 别 人 怎么 想 。 


然而 ， 在 许多 情况 下 ， 一 个 人 获得 某 个 项 目的 决定 将 取决 于 其 他 
人 做 了 什么 。 网 络 效应 (network effect) 有 两 个 可 能 发 生 的 原 
。 首先 ， 服 务 或 产品 的 价值 可 能 取决 于 使 用 它 的 人 数 。 如 果 别 人 都 
没有 电话 ， 它 对 你 有 什么 用 呢 ? 如 果 你 是 唯一 使 用 过 脸 书 的 人 ， 它 还 
会 这 么 有 趣 吗 ? 这 些 产品 和 服务 具有 积极 的 网 络 效应 〈positive 
network effect) : 使 用 它们 的 人 越 多 ， 它 们 对 每 个 人 就 变 得 越 有 价 
值 。 


第 二 ， 知 道别 人 对 一 个 项 目的 看 法 会 影响 你 的 决定 。 你 有 没有 因 
为 朋友 告诉 你 某 部 电影 好 而 看 它 ， 不 管 它 是 否 是 你 平时 喜欢 的 类 型 ? 
在 这 些 情况 下 ， 人 们 的 意见 和 决定 受到 他 人 的 有 影响。 群众 不 再 像 第 三 
部 分 那样 < 明智 ”了 ， 因 为 我 们 在 那里 关于 独立 决策 的 假设 不 再 成 立 。 
结果 反而 是 群众 的 廖 误 (fallacy of crowds) 。 


这 些 因 素 中 的 哪个 适用 于 在 YouTube 上 选择 观看 视频 的 人 ? 网 站 
本 身 确 实 有 积极 的 网 络 效 应 ， 但 这 并 没有 真正 影响 某 人 十 否 会 选择 观 
看 某 个 视频 。 更 具 影 响 力 的 是 其 他 两 个 成 分 〈 见 图 9-6) : 该 视频 片段 
对 此 人 的 内 在 价值 〈 即 是 否 符合 他 的 喜好 ) ， 以 及 群众 的 雇 误 ( 即 他 
是 否 看 到 很 多 其 他 人 观看 该 视频 ) 。 后 者 基于 将 视频 浏览 通过 人 和 群 传 
播 的 网 络 效应 ， 因 此 对 祝 频 病毒 式 传播 的 影响 较 大 。 
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内 在 价值 网 络 效应 


图 9-6 
注 : 影响 YouTube 视 频 受 欢迎 程度 的 两 个 因素 是 其 内 在 价值 和 网 络 效 应 


对 网 络 效 应 进行 量化 并 非 易 事 ， 这 取决 于 个 人 人、 项目 和 兴趣 情 
况 。 接 下 来 ， 我们 将 看 一 个 信息 瀑布 (information cascade) 模 
型 ， 这 是 一 个 群众 雇 误 的 简单 例子 。 


% 


群众 恋 误 : 信息 瀑布 


如 果 你 看 见 有 人 站 在 街角 仰望 天 空 ， 你 会 怎么 做 ? 你 可 能 会 认为 
她 流 蜡 血 了 ， 然 后 继续 做 目 己 的 事 。 但 是 ， 如 采 你 看 到 10 个 人 站 在 一 
起 仰望 天 空 ， 如 图 9-7 所 示 ， 你 会 怎么 做 ? 那 你 可 能 会 停 下 来 看 ， 认 为 
可 能 出 什么 事 了 。 这 个 人 的 行为 会 使 人 群 变 得 更 大 ， 下 一 个 经 过 的 人 
将 看 到 11 个 人 ， 更 会 忍 不 住 停 下 来 看 。 


图 9-7 所 有 人 都 站 在 街角 仰望 天 空 
注 : 这 会 让 路 过 的 人 认为 有 可 能 出 什么 事 了 ， 使 他 们 也 跟着 看 


这 是 一 个 典型 的 信息 瀑布 的 例子 ， 人 们 跟随 人 群 的 行动 ， 而 忽略 
自己 的 内 部 动因 。 当 关于 意见 的 独立 性 假设 〈 本 书 第 三 部 分 群众 智慧 
的 前 提 ) 不 成 立 ， 信 息 瀑布 便 会 出 现 。 事 实 上 ， 它 体现 了 截然 相反 的 
情况 : 决策 过 程 不 是 完全 独立 的 ， 而 是 完全 取决 于 之 前 发 生 过 什么 。 


关于 信息 瀑布 的 所 有 实例 估计 能 写 一 整 本 书 :， 从 股票 市 场 泡沫 到 
时 尚 潮流 ， 再 到 历史 上 集权 主义 政权 的 瓦解 。 它 们 如 何 被 应 用 到 视频 
的 病毒 式 传播 ? 你 更 可 能 会 遇 到 一 个 已 经 流行 的 视频 ， 即 使 它 不 符合 
你 的 口味 ， 你 可 能 还 是 会 忍 不 住 想 看 看 它 和 是 怎么 回 事 。 如 有 果 你 不 喜欢 
它 ， 可 能 会 决定 集 止 观看 ， 但 这 仍然 会 计 入 视频 旁边 显示 的 浏览 妆 
量 ， 并 部 分 决定 其 在 推荐 页 的 位 置 。 更 高 的 浏 咒 计 数 将 反 过 来 影响 更 
多 的 人 ， 并 且 这 种 累积 还 在 继续 。 


依次 做 出 决策 


我 们 需要 看 看 最 终 触发 信息 瀑布 的 过 程 。 在 顺序 决策 
(sequential decision making) 中 ， 每 个 人 得 到 一 个 私人 信号 ( 例 
如 ， 我 的 鼻子 开始 流血 ) ， 并 采取 一 个 公开 动作 〈 例 如 ， 抬 头 望 向 天 
空 ) 。 随 后 的 用 户 可 以 观察 到 公开 动作 而 不 是 私人 信号 。 如 果 此 时 有 


足够 多 的 同一 类 型 的 公开 动作 (例如 ， 有 10 个 人 仰望 天 空 ) ， 那 么 所 
有 后 来 的 用 户 将 忽略 目 己 的 私人 信号 ， 只 会 模仿 别人 的 动作 。 此 时 ， 
言 思 瀑布 被 触发 。 


多 少 公 开动 作 才 够 触发 信息 瀑布 ? 这 取决 于 当前 情况 。 例 如 ， 相 
比 让 人 们 仰望 天 空 ， 要 让 所 有 人 都 看 你 的 YouTube 视 频 可 能 会 难得 
多 。 这 也 取决 于 所 涉及 的 人 。 如 果 人 们 更 愿意 把 他 人 的 公开 动作 作为 
动因 ， 那 么 信息 瀑布 束 可 以 更 快 局 动 。 


言 息 瀑布 可 以 通过 正 反 馈 (positive feedback) 扩展 到 更 大 规 
模 。 你 可 以 在 图 9-8 中 看 到 这 一 点 : 更 多 的 人 表现 出 相同 的 公开 动作 ， 
给 下 一 个 人 更 多 跟随 的 动力 ， 这 使 得 群体 变 得 更 大 ， 从 而 提供 更 多 动 
力 ， 以 此 类 推 。 还 记得 我 们 在 本 书 第 一 部 分 对 负 反 馈 的 讨论 吗 ? 正 反 
馈 与 此 相反 。 在 前 者 中 ， 我 们 系统 地 抵消 某 种 效果 以 达到 网 络 中 的 平 
衡 〈 例 如 通过 第 1 章 的 分 布 式 功率 控制 或 第 3 章 的 基于 使 用 的 定价 ) 。 
在 后 者 中 ， 该 效果 依靠 自己 持续 的 影响 力 产 生 更 多 有 影响， 并 继续 增 
长 。 这 两 种 类 型 的 反馈 都 是 网 络 中 的 重要 主题 。 


每 个 人 都 遵循 的 公开 动作 走 正 确 的 还 是 错误 的 ? 两 者 都 有 可 能 ， 
错误 的 信息 瀑布 (例如 ， 每 个 人 都 在 仰视 ,但 天 空中 没有 什么 有 趣 的 
东西 ) 是 群众 雇 误 的 缩影 。 但 信息 瀑布 也 是 脆弱 的 ， 即 使 一 些 私 人 信 
号 被 泄露 给 公众 例如， 在 街道 的 抛 角 处 有 一 个 人 大 喊 :“ 我 在 仰望 天 
空 ， 因 为 我 流 里 血 了 ! ”) ， 它 也 可 能 会 迅速 消失 ， 甚 至 逆转 方向 。 为 
什么 ? 因为 人 们 在 跟随 人 群 ， 尽 管 许 多 人 在 做 同样 的 事情 ， 但 他 们 对 
目 己 在 做 的 事情 几乎 没有 信心 。 
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图 9-8 顺序 决策 中 的 正 反 馈 
注 : 随 着 采取 相同 公开 动作 的 人 数 增加 ， 下 一 个 人 会 更 忍 不 住 模仿 该 动作 ， 使 采取 该 动作 的 
人 数 增加 ， 以 此 类 推 
多 年 来 ， 人 们 提出 了 几 种 顺序 决策 的 模型 。 接 下 来 我 们 将 看 看 一 
个 人 简单 的 模型 。 


“ 猜 数字 ” 忆 想 实 验 


假设 有 一 群 人 排队 玩 一 个 猜 数字 游戏 。 主 持 人 选择 数字 0 或 1 作为 
正确 答案 。 每 次 会 有 一 个 人 走 上 黑板 ， 写 下 自己 猜测 的 数字 (图 9- 
9) 。 


当 一 个 人 走 上 黑板 ， 主 持 人 会 网 其 展示 一 张 卡 片 ， 上 面 写 
着 “0? 或 “1”。 这 是 此 人 的 私人 信号 。 如 条 正确 答案 征 “0”， 主 持 人 有 比 
如 80% 的 概率 会 选择 有 “0” 的 卡片 ， 有 20% 的 概率 选择 有 “1” 的 卡片 。 如 
果 管 案 是 “1”"， 主 持 人 有 80% 的 概率 会 选择 有 “1” 的 卡片 ， 有 20% 的 概率 


选择 有 “0 的 卡片 。 显 示 的 数字 不 一 定 是 正确 的 ， 但 是 每 个 人 都 被 告 
知 ， 他 们 看 到 的 卡片 正确 比 错误 的 概率 更 高 。 
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图 9-9 
注 ， 在 这 个 思想 实验 中 ， 一 些 人 排 好 队 ， 每 次 会 有 一 个 人 被 叫 到 黑板 上 写 下 自己 的 猜测 。 这 
有 可 能 是 当 第 三 个 人 上 去 时 ， 黑 板 的 样子 

黑板 上 每 个 人 的 猜测 都 是 其 公开 动作 。 当 有 人 进行 猜测 时 ， 她 会 
看 到 前 面 所 有 人 的 公开 动作 ， 但 没有 看 到 疝 他 们 显示 的 私人 信号 。 作 
为 示例 ， 图 9-9 和 9-10 显 示 了 ， 当 第 三 人 走 上 黑板 时 的 情况 : 
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图 9-10 


注 : 第 三 人 看 到 前 两 人 的 公开 动作 〈 公 开 I 和 公开 IID) ， 并 得 到 自己 的 私人 信号 〈《 私 人 IITD) 。 
根据 这 些 信息 ， 她 在 黑板 上 写 下 自己 的 猜测 〈 公 开 IID) 


。 她 看 到 一 张 卡 片上 的 私人 信和 号， 我 们 称 之 为 私人 III。 
。 她 看 到 了 前 两 个 用 户 在 黑板 上 的 公开 动作 ， 我 们 称 之 为 公开 1I 
和 公开 II 。 


* 根据 这 些 信 息 ， 她 的 任务 是 做 出 目 己 的 猜测 一 一 公开 IT， 并 
写 在 黑板 上 。 


假设 爱丽 丝 是 第 一 个 上 去 的 人 。 她 该 怎么 办 呢 ? 目前 黑板 上 还 没 
有 内 容 ， 所 以 她 只 能 依靠 卡片 上 的 数字 。 她 知道 这 个 数字 更 可 能 是 对 
的 。 所 以 如 采 她 看 到 0， 她 会 写 0， 如 果 她 看 到 1， 她 会 写 1 。 


饮 动 第 二 个 上 去 。 他 的 情况 和 爱丽 丝 有 什么 不 同 ? 他 不 仅 看 到 腕 
丽 丝 写字 的 公开 动作 (公开 I) 和 他 自己 的 私人 信号 (私人 I1) ， 还 知 
道 爱丽 丝 如 何 分 析 。 他 看 不 到 她 的 私人 信和 号， 但 知道 它 一 定 和 公开 I 一 
样 ， 因 为 爱丽 丝 进 行 猿 测 时 没有 其 他 信息 。 所 以 鲍 动 实际 上 知道 两 个 
私人 信和 号， 私人 I 和 私人 II: 


“如 采 它 们 都 征 0， 那 么 显然 他 会 写 下 0。 这 比 爱丽 丝 面 对 的 情 
况 更 有 利 。 

* 如 果 它 们 都 是 1， 那 么 同样 ， 他 也 会 写 下 1。 

， 但是， 如 果 它 们 不 一 样 呢 ? 那 他 束 没 有 提示 表明 哪个 数 子 更 
可 能 十 正确 的 。 他 的 卡片 和 她 的 相互 了 矛盾。 在 这 种 情况 下 ， 他 会 抛 
硬币 ， 随 机 写 下 0 或 1。 


现在 是 信息 瀑布 出 现 的 第 一 种 情况 。 当 第 三 个 人 卡拉 上 去 猜测 ， 
她 有 什么 信息 ? 她 有 一 个 私人 信号 (私人 IH) ， 以 及 两 个 公开 动作 
(公开 I 和 公开 ID 。 卡 拉 需 要 比较 公开 I 和 公开 IT。 


站 先 ， 如 果 它 们 古 不 同 的 呢 ? 那 卡拉 就 知道 爱丽 丝 和 鲍 动 的 私人 
信号 肯定 也 是 不 同 的 。 鲍 动 一 定 发 现 了 信息 不 匹配 ， 并 随机 猜测 。 这 
两 个 相互 冲突 的 私人 信号 互相 抵消 ， 使 卡拉 处 于 和 第 一 个 人 爱丽 丝 相 
同 的 情况 。 然 后 她 仅 基 于 自己 的 私人 信号 (私人 人 ITH) 进行 猜测 。 


那么 ， 如 果 公 开 I 和 公开 II 是 相同 的 呢 ? 


“如 采 卡 拉 的 私人 IT 与 其 一 致 ， 那 么 结 采 显而易见 : 她 知道 有 
两 个 信号 说 出 她 的 数字 (她 和 爱丽 丝 的 ) ， 另 一 个 可 能 也 一 致 ( 鲍 
勃 的 ) 。 所 以 ， 她 应 该 选择 这 个 数字 作为 公开 III。 

* 这 里 是 真 正 有 意思 的 地 方 。 如 果 卡 拉 的 私人 II 与 公开 1I 和 公开 
II 不 一 致 ， 她 的 狂 测 最 好 是 无 视 她 的 私人 信号 ， 而 和 前 两 个 公开 动 
作 保持 一 致 


所 以 如 果 前 两 个 人 《爱丽 丝 和 鲍 勃 ) 写 下 相同 的 猜测 ， 那 么 信息 
瀑布 就 启动 了 。 第 三 个 人 (卡拉) 的 理性 选择 是 与 大 家 保持 一 致 。 如 
果 第 三 个 人 这 样 做 ， 那 么 第 四 个 人 也 会 这 样 ， 以 此 类 推 (直到 发 生 其 
他 事 来 打破 信息 瀑布 ) 。 


为 什么 信息 瀑布 会 在 前 两 个 人 后 出 现 ? 让 我 们 在 逻辑 上 进行 分 
解 。 卡 拉 知 道 爱 丽 丝 的 私人 信和 号 是 什么 。 由 于 对 方 和 她 的 不 同 ， 两 者 
将 抵消 ， 所 以 卡拉 的 决定 可 归结 为 她 对 鲍 动 私人 信号 的 推测 是 什么 。 
回 到 他 的 决定 ， 有 两 种 方式 能 让 他 的 公开 动作 和 爱丽 丝 的 一 致 : 


1. 鲍 支 的 私人 II 与 爱丽 丝 的 公开 I 一 致 《这 意味 着 鲍 邦 的 公开 动 
作 是 其 私人 信号 ) : 

2. 饱 革 的 私人 II 与 爱丽 丝 的 公开 I 不 一 致 ， 但 是 当 他 随机 选择 
时 ， 他 决定 写 下 公开 I (这 意味 着 鲍 劲 的 公开 动作 不 是 其 私人 信 
EE 


第 一 种 情况 更 有 可 能 。 所 以 ， 鲍 动 更 可 能 以 他 的 私人 信 与 作为 猫 
测 。 因 此 ， 卡 拉 的 最 佳 选择 是 以 公开 I 作为 其 猜测 ， 这 样 束 形 成 了 信 
居 瀑 布 。 


要 是 前 两 个 人 之 后 没有 出 现 信 息 瀑 布 呢 ?那么 一 切 重 新 开始 ， 信 
忌 滩 布 同 样 可 以 在 接 下 来 的 两 个 人 之 后 出 现 ， 或 是 后 面 两 个 人 之 后 ， 
以 此 类 推 。 所 需要 的 是 ， 茶 个 处 于 偶数 顺序 的 人 采取 和 她 前 面 奇 数 顺 
序 的 人 同样 的 公开 动作 。 在 图 9-11 中 ， 在 第 三 个 和 第 四 个 人 采取 公开 
动作 1 之 后 ， 出 现 了 1 的 信息 瀑布 。 


信息 滩 布 


ou 


图 9-11 
注 : 当 第 三 个 人 和 第 四 个 人 的 猜测 都 为 1 时 ， 便 会 触发 信息 瀑布 


形成 信息 漂 布 


我 们 要 多 久 才能 形成 信息 瀑布 ? 打破 信息 瀑布 有 多 容易 ? 我 们 将 
在 本 部 分 通过 猜 数 字 实 验 的 一 些 数值 例子 ， 探 讨 这 些 问题 。 如 末 你 愿 


意 ， 也 可 以 跳 过 下 面 的 计算 ， 直 接 进 入 下 一 部 分 。 


第 一 对 猜测 者 


在 我 们 的 实验 中 ， 爱 丽 丝 和 鲍 盈 古 第 一 对 进行 猜测 的 人 。 假 设 主 
持 人 已 经 决定 将 1 作为 正确 答案 ， 她 癌 每 个 人 展示 1 作为 其 私人 信和 号 的 
概率 是 80% 〈 我 们 称 之 为 主持 人 的 概率 ) 。 


要 分 解 不 同类 型 的 瀑布 ， 最 简单 的 方法 是 通过 如 图 9-12 中 的 树 形 
图 ， 它 显示 了 基于 爱丽 丝 和 鲍 芝 私人 信和 号 的 6 种 不 同 可 能 性 。 其 中 ， 两 
种 可 能 性 导致 不 正确 的 信息 瀑布 〈 均 为 公开 动作 0) ， 两 种 导致 正确 的 
信息 瀑布 〈 均 为 公开 动作 1) ， 两 种 不 会 导致 信息 瀑布 (公开 动作 不 
同 ) 。 例 如 ， 私 人 I=1， 私 人 I= 0， 抛 硬币 = 1， 导 致 爱丽 丝 得 到 (并 
猜测 ) 1， 然 后 鲍 勃 得 到 0， 抛 硬币 并 猜测 1， 然 后 触发 正确 的 信息 瀑布 
1 Oo 
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图 9_12 前 两 个 猜测 者 所 有 可 能 发 生 的 情况 
注 ， 四 种 突出 显示 的 情况 将 触发 信息 瀑布 
在 回合 结束 时 ， 没 有 触发 信息 瀑布 的 概率 是 多 少 ? 要 使 这 种 情况 
发 生 ， 我 们 需要 前 两 个 公开 动作 不 同 ， 也 就 是 (i) 公开 I = 0 且 公 开 II 
= 1 或 〈ii) 公开 I= 1 且 公 开 IT = 0。 从 图 中 ， 你 可 以 看 到 ， 对 于 下 列 组 
合 的 私人 信和 号， 将 出 现 这 些 情况 : 


。 (i) 私人 I= 0， 私 人 II = 1， 抛 硬币 = 1: 爱丽 丝 得 到 私人 信 
号 0 的 概率 是 多 少 ? 由 于 看 到 1 的 概率 是 80%， 因 此 得 到 0 的 概率 是 
209%6。 那 么 ， 鲍 勃 得 到 1 的 概率 是 多 少 ? 80%。 抛 硬币 得 到 1 的 概率 
是 多 少 ? 50%。 因 为 这 三 个 独立 事件 中 的 每 一 个 都 必须 发 生 ， 因 此 
我 们 将 它们 相 乘 ， 得 到 发 生 这 种 情况 的 总 概率 : 0.20x0.80x0.5 = 
0.08， 或 89%。 

。 (ii) 私人 I= 1， 私 人 I=0， 抛 硬币 = 0: 这 是 我 们 刚刚 看 到 
的 思路 的 逆 癌 。 爱 丽 丝 看 到 1 的 概率 是 多 少 ? 80%。 鲍 勃 看 到 0 的 概 
率 是 多 少 ? 20%。 抛 硬币 得 到 0 的 概率 是 多 少 ? 50%。 这些 概率 得 
到 相同 的 结果 : 0.20x0.80x0.5 = 0.08， 或 8%。 


由 于 (i) 和 (ii) 都 没有 产生 信息 瀑布 ， 因 此 我 们 将 它们 相 加 ， 
得 到 总 概率 : 8% + 8% = 16%。 


言 息 瀑布 发 生 的 概率 是 多 少 ? 答案 很 简单 : 16% 是 它 不 发 生 的 概 
率 ， 所 以 100% - 169% = 84% 是 发 生 的 概率 。 我 们 能 进一步 分 解 这 个 
84% 吗 ? 是 的 ， 因 为 可 能 发 生 两 种 不 同 的 信息 瀑布 : 正确 (1) 或 不 正 
确 (0) 。 请 记 住 ， 不 正确 的 信息 瀑布 是 这 个 模型 中 的 群众 恋 误 的 缩 


二 和 
尿 2 ° 


要 得 出 这 些 概率 ， 在 图 9-13 中 ， 六 种 不 同 结果 将 被 分 解 。 对 于 每 
一 种 情况 ， 我 们 沿 着 分 支 把 概率 相 乘 : 例如 ， 私 人 I 为 0O 有 20% 的 概 
率 ， 私 人 I 为 1 有 80% 的 概率 ， 抛 硬币 得 到 0 有 50% 的 概率 ， 因 此 这 一 系 
列 事件 发 生 的 概率 为 0.2x0.8x0.5 = 0.08， 或 8%。 把 相关 可 能 性 相 加 ， 
正确 信息 瀑布 发 生 的 概率 是 64% + 8% = 72%， 不 正确 信息 瀑布 发 生 的 
概率 是 4% + 8% = 12%。 


soper 公开 1=0, 公开 了 =1 一 一 一 一 * 8% 
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图 9-13 


注 : 我 们 例子 中 的 六 种 结果 ， 每 个 发 生 的 概率 都 显示 在 树 形 图 右 侧 


出 现 正确 信息 瀑布 的 概率 古 相 当 高 的 。 为 什么 ? 还 记得 我 们 在 开 
始 时 对 主持 人 做 的 假设 吗 ? 他 有 809% 的 概率 向 每 个 人 显示 正确 的 私人 
信号 (1) 。 那 也 相当 高 。 如 果 我 们 降低 该 数值 ， 事 实证 明 ， 不 正确 的 
信息 瀑布 和 不 出 现 信息 瀑布 都 将 变 得 更 有 可 能 。 更 多 关于 这 段 关 系 和 
更 详细 计算 过 程 的 信息 ， 请 参考 本 书 网 站 Q9.1 和 Q9.2 部 分 。 


未 来 的 猜测 对 儿 


在 爱丽 丝 和 鲍 动 之 后 ， 不 出 现 信 息 泽 布 的 概率 是 16%。 那 么 在 卡 
拉 之 后 后 么 样 ? 请 记 住 ， 第 三 个 人 自身 不 能 触发 信息 瀑布 。 如 采 鲍 动 
之 后 没有 触发 ， 那 么 卡拉 又 从 头 开始 (没有 信息 ) ， 和 爱丽 丝 的 处 境 
相同 。 所 以 在 前 三 个 人 之 后 ， 不 出 现 信息 瀑布 的 概率 仍然 是 16% 。 


达 娜 之 后 会 怎么 样 ? 现在 可 以 触发 信息 瀑布 的 方式 有 两 种 : 一 种 
是 在 爱丽 丝 和 鲍 劲 之 后 ， 男 一 种 是 在 卡拉 和 达 娜 之 后 。 要 在 他 们 之 后 
不 产生 信息 瀑布 ， 我 们 需要 第 一 对 〈 爱 丽 丝 和 鲍 勃 ) 和 第 二 对 (卡拉 
和 达 娜 ) 都 不 触发 。 我 们 将 每 对 参与 者 不 形成 信息 瀑布 的 概率 相 乘 : 
0.16x0.16 = 0.0256， 或 2.56%。 因此， 在 达 娜 之 后 ， 有 超过 97% 的 概率 
会 形成 信息 瀑布 。 


那么 埃 文 之 后 呢 ? 作为 第 三 对 中 的 第 一 个 人 ， 他 不 会 触发 信息 瀑 
布 ， 所 以 概率 保持 不 变 : 2.56%。 弗兰克 之 后 呢 ? 现 在 我 们 有 三 个 产 
生 信 息 溪 布 的 概率 ， 分 别 是 鲍 勃 、 达 娜 和 弗兰克 之 后 ， 所 以 我 们 乘 三 
次 : 0.16x0.16x0.16 = 0.0041， 或 0.41%。 这 个 不 产生 信息 瀑布 的 概率 
很 小 。 


现在 你 可 能 找 出 规律 了 ， 如 图 9-14 所 示 。 为 了 算出 第 “N” 对 后 仍 
然 没 有 信息 瀑布 的 概率 ， 我 们 将 0.16 乘 以 “N” 深 。 对 于 5 对 ， 它 变 成 
0.16x0.16x0.16x0.16x0.16 = 0.000 105 ( 即 约 1/ 100 的 1%) 。 对 于 50 
对 ， 小 数 点 后 第 一 个 有 效 数 字 之 前 有 37 个 零 ! 
一 一 没有 形成 信息 瀑布 的 概率 一 


100% 16% 160% 2.56% 2.56% 0.41% 0.41% 
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图 9-14 
注 : 在 猜 数 字 实验 中 ， 随 着 更 多 参与 者 进行 猜测 ， 没 有 形成 信息 瀑布 的 概率 会 降低 


显然 ， 这 个 概率 正 迅 速 趋 于 零 。 所 以 在 几 对 之 后 ， 我 们 差不多 确 


定 会 产生 信息 瀑布 。 此 时 ， 未 来 人 们 的 决定 已 经 完全 取决 于 目前 的 情 
i 


但 请 记 住 ,， 信 息 滩 布 可 能 正确 ， 也 可 能 不 正确 。 在 某 一 对 进行 猜 
测 后 ， 我 们 可 以 计算 出 每 一 种 结果 的 可 能 性 吗 ? 是 的 ， 但 相 比 反复 相 
乘 ， 这 些 公式 需要 更 多 的 数学 计算 。 事 实证 明 ， 进 行 猜测 的 参与 者 对 
数 不 会 在 很 大 程度 上 改变 每 种 信息 瀑布 类 型 的 概率 。 例 如 ， 当 主持 人 
的 概率 为 80% 时 ， 错 误 信 息 梁 布 的 概率 从 一 对 后 的 12% 上 升 至 三 对 后 


的 约 15%6， 而 正确 信息 瀑布 的 概率 从 约 72% 上 升 至 约 859%。 正 确信 息 瀑 
布 仍 然 明 显 更 有 可 能 。 


无 论 有 多 少 对 数 ， 主 持 人 的 概率 都 是 影响 信息 瀑布 类 型 的 唯一 因 
素 。 例 如 ， 如 果 主 持 人 的 概率 下 降 到 60%， 最 终 产生 错误 信息 瀑布 的 
概率 将 超过 35%， 产 生 正确 信息 瀑布 的 概率 将 低 于 65% 。 当 主持 人 的 
概率 为 50% 时 ， 两 者 将 同样 可 能 出 现 ! 


要 了 解 这 些 关 系 的 详细 图 示 ， 请 参考 本 书 网 站 Q9.3 部 分 。 可 以 
说 ， 如 来 我 们 的 目标 是 触发 正确 的 信息 瀑布 ， 我 们 必须 希望 主持 人 更 
为 频繁 地 展示 正确 的 数值 而 非 错误 的 。 这 一 点 有 些 不 合 常 理 ， 因 为 当 
参与 者 的 对 数 很 大 时 ， 我 们 预计 能 获得 大 量 信息 ( 即 更 多 的 公开 动 
作 ) ， 正 确 的 信息 瀑布 应 该 很 可 能 会 产生 。 但 信息 瀑布 阻碍 了 独立 信 
思 的 聚集 ， 这 对 我 们 在 第 三 部 分 关于 群众 智慧 的 讨论 十 分 重要 。 只 需 
要 一 对 参与 者 展示 两 个 0 或 两 个 1， 束 能 使 未 来 所 有 的 公开 动作 都 变 得 


星 帝 的 新 衣 


现在 你 知道 ， 信 息 滩 布 的 形成 是 多 么 容易 。 一 旦 被 触发 ,信息 泽 
布 会 持续 多 久 ? 答案 是 永远 ， 除 非 出 现 茶 种 干扰 (如 泄露 私人 信 
号 ) 。 需 要 多 少 次 干扰 ?” 有趣 的 是 ， 无 论 信息 瀑布 已 经 持续 多 久 ， 通 
彰 几 次 干扰 就 足够 了 。 尽 管 有 很 多 人 参与 ， 但 每 个 人 都 知道 ， 他 们 基 
本 上 只 是 在 玩 一 个 跟随 领导 者 的 游戏 ， 以 最 大 限度 地 提高 他 们 猜测 正 
确 的 概率 。 


皇帝 的 新 衣 效 应 (Emperor’s New Clothes effect) 概括 了 信 
息 瀑 布 的 脆弱 性 。 这 个 名 称 来 自 19 世 纪 汉 斯 .克里斯蒂 安 .安徒生 的 短篇 
故事 (图 9-15) : 虚荣 的 皇帝 得 知 ， 他 的 “新 衣 ” 是 用 最 好 的 面料 制 成 


的 ， 只 有 那些 不 称职 的 人 才 看 不 见 。 事 实 上 ， 根 本 没有 衣服 。 虽 然 每 
个 人 都 在 表演 ( 即 他 们 的 公开 动作 ) ， 但 都 不 想 显 得 不 称职 ( 即 他 们 
的 私人 信号 ) 。 只 要 一 个 孩子 喊 道 : “ 嘿 ， 他 什么 都 没 穿 ! ”大 家 都 更 
加 确信 ， 旦 帝 确 实在 大 庭 广 众 下 赤身 裸体 。 


图 9-15 
注 : 皇帝 的 新 衣 效 应 表示 ， 信 息 瀑布 可 以 很 容易 地 被 打破 


回 到 我 们 的 狂 数 字 实 验 ， 如 何 打破 信息 瀑布 ? 假设 第 一 对 参与 者 
后 出 现 1 的 信息 瀑布 。 一 段 时 间 后 ， 轮 到 弗兰克 进行 猜测 ， 他 得 到 0 作 
为 他 的 私人 信号 。 作为 公开 动作 ， 他 猜测 1， 但 他 也 喊 出 他 的 信和 号 是 
0 。 


现在 轮 到 格雷 戈 ， 他 也 得 到 了 私人 信号 0。 他 有 以 下 关于 私人 信和 号 
的 信息 : 


* 一 方面 ， 至 少 有 一 个 1， 来 目 爱 丽 丝 。 但 他 不 能 确定 鲍 劲 古 
人 否 有 一 个 1， 因 为 鲍 芝 可 能 得 到 的 是 0(， 并 抛 硬币 决定 。 


* 忆 一 方面 ， 至 少 有 两 个 0: 他 和 弗兰克 的 。 


那么 ， 格 雷 戈 会 怎么 做 呢 ? 他 会 猜测 0， 因 为 有 更 多 证 据 表 明 这 有 征 
正确 的 。 这 个 猜测 打破 了 信息 汉 布 。 请 记 住 ,信息 梁 布 只 表示 其 出 现 
时 间 前 后 的 几 个 人 采取 的 行动 。 如 采 大 家 都 知道 这 点 ， 男 外 几 个 人 可 
能 会 打破 它 。 


有 许多 其 他 因素 


在 猜 数 子 实验 中 ， 只 需要 两 个 人 束 能 引发 信息 瀑布 。 在 更 通常 的 
情况 下 ， 要 让 一 个 人 忽视 其 本 能 ， 所 需要 的 人 群 大 小 取决 于 (i) 具体 
情境 和 (ii) 具体 个 人 。 例 如 ， 比 起 在 黑板 上 匹配 数字 ， 一 个 路 人 可 能 
需要 看 到 更 多 人 在 街角 仰 着 头 ， 才 会 选择 从 众 。 比 起 一 个 无 聊 而 好 奇 
的 人 ， 需 要 更 多 人 在 街角 仰 着 头 ， 才 会 让 一 个 匆忙 赶路 的 过 路 人 也 这 
样 做 。 


但 也 许 我 们 在 这 里 所 做 的 最 深远 的 假设 是 ， 每 个 人 的 行为 都 钙 理 
性 的 。 我 们 假设 每 个 人 都 可 以 也 会 基于 他 们 的 信息 ， 决 定 什 么 是 最 好 
的 猜测 。 这 个 假设 总 是 正确 的 吗 ? 绝对 不 是 。 每 个 人 应 该 做 的 事情 和 
他 在 现实 中 所 做 的 可 能 完全 不 同 。 研 究 人 员 已 经 观察 到 ， 猜 数字 思维 
实验 并 不 像 理论 预测 的 那样 有 效 ， 可 能 是 因为 大 多 数 人 并 没有 在 头脑 
中 对 概率 进行 这 种 推理 。 


我 们 如 何 能 将 顺序 决策 转化 ， 以 实现 YouTube 视 频 的 病毒 式 传 
播 ? 这 并 不 容易 ， 但 主要 观点 应 该 是 明确 的 : 你 希望 你 的 视频 引发 信 
娠 瀑布 ,这样 ， 当 一 个 人 看 到 或 听 说 它 之 后 ( 即 公 开动 作 ) ，， 他 很 可 
能 会 观看 它 ， 无 论 它 是 否 符合 其 内 在 利益 ( 即 其 私人 信和 号) 。 在 一 个 
人 目 动 观看 你 的 视频 之 前 ， 需 要 多 少 公开 动作 ? 这 样 的 数字 是 否 存 


在 ? 即便 有 此 类 数字 ， 它 对 每 个 人 来 说 都 是 不 同 的 ， 这 取决 于 人 的 顺 
从 程度 。 这 些 都 是 有 趣 的 问题 ， 还 没有 明确 的 答案 。 


第 10 章 
影响 他 人 


第 9 章 的 主要 信息 是 什么 ? 接触 公众 与 论 打 破 了 群众 智慧 所 需 的 独 
立 性 。 在 随后 的 恋 误 中 ， 人 们 会 受到 他 人 行为 的 影响 。 


在 本 章 中 ， 我 们 将 继续 探讨 天 于 影响 的 主题 ， 这 次 我 们 会 更 多 天 
注 社 会 网 络 育 后 的 图 像 。 0 
基础 的 场景 ， 它 假定 不 管 两 个 人 的 关系 是 什么 ， 一方 的 公开 动作 对 男 
一 方 有 同样 的 效果 (如 图 10-1 所 示 ) 。 转 向 脸 书 和 推 特等 社交 网 站 ， 
我 们 的 讨论 将 围绕 影响 依赖 拓扑 的 方面 ， 而 不 是 以 人 口 为 基础 。 
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图 10-1 第 9 章 猜 数字 思维 实验 中 的 假设 人 群 关系 
注 : A 到 B 的 连接 表示 B 从 A 获得 信息 ( 即 公开 动作 ) 


2 


会 影响 的 场所 


脸 书 中 的 友谊 


如 今 最 大 的 社交 网 络 应 用 是 什么 ? 脸 书 (图 10-2) 。2016 年 3 月 ， 
有 16.5 亿 人 至 少 登 录 过 脸 书 一 次 ， 这 个 数字 占 全 球 总 人 口 的 V5 以 上 。 


图 10-2 脸 书 〈 左 ) 和 推 特 〈 右 ) 的 商标 标识 


2004 年 1 月 ， 马 克 : 扎 克 伯 格 为 他 的 哈佛 大 学 同学 推出 了 社交 网 
站 “Thefacebook”。 它 迅速 吸引 了 超过 一 半 的 哈佛 在 校生 ， 并 在 3 个 月 
内 扩展 到 其 他 常春 腾 盟 校 ， 了 逐渐 得 到 美国 和 加 拿 大 多 数 高 校 的 关注 。 
2005 年 ， 脸 书 从 其 名 字 中 删 去 “the"”， 并 向 高 中 生 开 放 ， 不 久 后 又 向 公 
司 员 工 开 放 。 但 直到 2006 年 9 月 ， 该 网 站 才 开 始 允 许 任何 13 罗 或 以 上 的 
人 ， 赁 有 效 电 子 邮 件 地 址 加 入 ， 这 种 注册 方式 沿用 至 今 。 


在 图 10-3 中 ， 你 可 以 看 到 2004 年 到 2015 年 ， 脸 书 每 月 活跃 用 户 数 
量 迅 速 增长 的 情况 。2012 年 ， 它 的 用 户 首 次 突破 10 亿 大 关 ， 并 于 同年 
进行 首次 公开 募股 (IPO) 。 
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图 10-3 自 2004 年 以 来 ， 脸 书 每 年 的 活跃 用 户 数 


到 2015 (2016) 年 ， 每 分 钟 有 超过 400 万 个 帖子 被 点 赞 ，3 200 万 
个 项 目 得 到 分 享 ，240 000 张 照片 被 上 传 到 脸 书 。 使 用 该 网 站 比例 最 大 
的 年 龄 组 为 25~34 多 ， 占 所 有 用 户 的 30%， 在 2006 年 脸 书 出 现时 ， 他 们 
正在 上 高 中 或 大 学 。 来 自 美 国 的 用 户 比 任何 其 他 国家 都 多 ， 但 脸 书 在 
国际 舞台 上 也 占据 一 席 之 地 ， 其 约 20% 的 用 户 来 自 欧 济 ， 还 有 20% 来 
自 亚 洲 。 


念书 的 “好 友 ?” 功 能 一 开始 就 使 它 很 受 欢 迎 。 想 想 过 去 多 年 来 ， 人 
们 通过 “添加 好 友 ” 按 钮 建立 的 所 有 联系 。 这 些 连接 以 及 它们 实现 的 互 
动 ， 弥 补 了 脸 书 作为 社交 媒体 和 社交 网 站 之 间 的 差距 。 


以 脸 书 用 户 为 节点 ， 我 们 可 以 通过 在 所 有 互 为 好 友 的 用 户 之 间 绘 
制 连接 ， 创 建 图 像 。 在 2015 (2016) 年 ， 大 约 有 15 亿 名 用 户 ， 平 均 每 
人 有 大 约 350 个 好 友 。 这 意味 着 网 像 有 15 亿 个 和 点 ， 以 及 1.5x350 / 2sx2 
600 亿 个 链接 〈 除 以 2 是 因为 我 们 不 想 将 同一 个 链接 计算 两 次 ) 。 这 是 
一 个 非常 庞大 和 复杂 的 结构 ， 也 会 使 人 产生 疑问 ， 到 底 是 什么 构成 脸 
书 上 两 个 人 之 间 的 链接 。 友 谊 当然 是 定义 链接 的 具体 方式 ， 但 也 许 某 
些 更 强大 的 概念 更 有 意义 ， 如 “好 友 ” 沟 通 的 次 数 ? 


在 推 竺 上 关注 


推 特 〈 见 图 10-2) 是 另 一 个 流行 的 社交 网 站 ， 它 赋予 用 户 使 用 微 
博 的 能 力 。 人 们 通过 它 可 以 发 送 和 接收 长 度 最 多 为 140 个 字符 的 文 
本 “ 推 特 ”， 并 “关注 ”其 他 人 。 到 2016 年 一 季度 ， 约 有 13 亿 个 Twitter 账 
户 被 创建 ， 其 中 有 3.1 亿 万 名 符合 每 月 活跃 用 户 的 标准 。 


2006 年 3 月 ， 推 特 由 杰克 :多 西 在 Odeo 网 站 首先 推出 。 同 年 7 月 ， 推 
特 网 站 成 立 ， 并 于 次 年 4 月 成 为 独立 的 公司 。 像 脸 书 一 样 ， 该 公司 自 成 
立 以 来 经 历 了 快速 成 长 ， 从 2007 年 每 季度 约 400 000 条 推 特 到 2008 年 每 
季度 1 亿 条 。 到 2015 年 其 诞生 9 周年 时 ， 用 户 每 天 几乎 收发 5 亿 条 推 特 。 

(差不多 每 秒 6 000 条 ! ) 


推 特 的 使 用 量 常常 在 重大 事件 发 生 时 迅速 增加 。 在 2011 年 夏季 美 
国 东海 岸 发 生地 震 后 ， 推 特 从 弗吉尼亚 到 纽约 的 传播 速度 比 地 震 还 
快 。 图 10-4 显 示 了 ， 地 震 发 生 仅 10 秒 和 80 秒 后 推 符 的 活动 情况 。 截 至 
2016 年 ， 促 使 推 特 最 多 发 送 数 量 的 一 次 事件 是 2015 年 2 月 举行 的 第 49 届 
美国 “超级 硫 ”(\ 国 家 橄榄 球 联盟 ) 大 赛 ， 在 比赛 期 间 人 们 共 发 送 2 510 
万 条 推 特 。 
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注 : 2011 年 夏季 ， 美 国 东海 岸 地 震 发 生 10 秒 ( 左 ) 和 80 秒 ( 右 ) 后 ， 推 符 的 活动 情况 


截至 2016 年 5 月 ， 凯 蒂 : 佩 里 是 推 符 上 最 受 关注 的 人 ， 她 有 8 800 万 
名 关注 者 ， 贾 斯 汀 : 比 伯 紧 随 其 后 ， 有 8 100 万 名 关注 者 。 对 于 名 人 ， 推 
特 上 单 向 的 关注 关系 ( 即 你 可 以 关注 他 们 ， 而 他 们 不 需要 关注 你 ) 对 
于 癌 粉 丝 广播 其 最 新 动态 特别 有 用 。 脸 书 上 名 人 页 面 的 “喜欢 ”功能 
是 这 样 3 


谁 是 “重要 的 *? 


仿 书 和 推 基 只 是 今天 存在 的 许多 在 线 社 交 了 网 站 中 的 两 个。 其 他 网 
站 都 是 围绕 具体 应 用 出 现 的 ， 从 Instagram 上 的 照片 和 视频 分 享 到 Yelp 
的 商业 评论 ， 再 到 慕 课 的 社会 化 学 习 〈 在 第 8 章 讨 论 过 ) 


关于 人 们 如 何在 这 些 网 络 中 表现 和 互动 ， 已 经 有 过 许多 人 研究。 人 
们 试图 回答 以 下 两 个 重要 问题 : 


1. 我 们 如 何 衡量 个 人 的 影 啊 力 ? 


2. 我 们 如 何 利 用 有 关 哪 些 人 具有 影响 力 的 知识 ， 对 在 线 用 户 产 
生 实 际 影响 ? 


这 些 都 不 容易 回答 。 理 论 和 实践 之 间 存 在 着 巨大 的 差距 ， 这 也 征 
在 本 书 中 能 够 看 到 的 最 大 的 问题 。 但 这 并 没有 阻止 人 们 导 找 答案 。 


例如 ， 关 于 第 一 个 问题 ， 一 些 公司 怠 在 记录 一 些 人 在 推 条 上 的 个 

影响 力 。 它 们 如 何 量化 一 个 人 的 影响 力 ? 有 几 种 可 能 的 做 法 ， 例 
如 ， 该 人 拥有 的 关注 者 数量 、 转 发 数量 或 较 帖 数量 。 一 些 公司 也 试图 
将 脸 书 的 整个 社交 图 组 合 起 来 ， 这 将 使 它们 了 解 网 络 中 哪些 人 是 最 重 
要 的 。 我 们 将 在 本 章 中 了 解 定义 重要 性 的 方法 。 


至 于 第 二 个 问题 ， 例 如 营销 公司 如 何 利 用 关于 影响 力 的 知识 来 销 
售 产品 ? 它们 将 设法 把 产品 放 到 那些 伞 认为 具有 最 高 储 会 影响 力 的 人 
们 手中 。 它 们 可 能 会 鼓励 一 些 有 影响 力 的 个 人 或 大 量 随 机 选择 但 相对 

影响 力 的 人 ， 项 望 别 人 看 到 这 些 人 手中 的 产品 后 ， 会 决定 购买 该 产 
品 。 在 本 章 后 面 的 部 分 ， 我 们 将 看 到 ， 找 到 宣传 产品 的 最 佳人 选 是 多 
么 困难 和 违反 直觉 的 。 


除了 营销 活动 之 外 ， 天 于 识别 和 利用 有 影响 力 的 个 人 ， 我 们 可 以 
写 一 整 本 书 。 一 个 有 趣 的 历史 故事 发 生 在 1775 年 美国 单 命 的 前 夜 ， 保 
多 .里 维尔 和 威廉 : 道 斯 进行 了 所 谓 的 午夜 忽 风 。 在 4 月 18 日 了 晚上， 他们 
从 波士顿 和 坎 布 里 奇 附近 出 发 去 提醒 类 国人 人， 英国 人 计划 在 列 死 星 救 
和 康 科 德 发 起 攻击 。 他 们 各 目 沿 看 不 同 的 路 径 去 列 克 星 敦 ， 在 那里 会 
合 之 后 ， 义 共同 前 往 康 科 德 。 在 前 往 列 元 星 吾 的 路 上 ， 里 维尔 成 功 提 
醒 了 极 具 影响 力 的 民兵 组 织 领导 人 ， 并 最 终 比 道 斯 更 有 效 地 传播 了 消 
思 。 这 在 第 二 天 帮助 类 国人 最 得 了 这 场 战 争 的 第 一 次 战斗 


社会 重要 性 的 常见 定义 


我 们 如 何 衡 量 一 个 人 在 社交 网 络 中 的 重要 性 ?从 网 络 的 社交 图 开 
始 ， 每 个 节点 都 是 一 个 人 ， 如 图 10-5 所 示 。 社 交 图 中 的 链接 可 以 象征 
什么 ? 这 有 很 多 可 能 性 ， 正 如 我 们 在 第 8 章 社 会 化 学 习 网 络 中 看 到 的 : 
它们 可 能 是 有 辣 或 无 同 ， 加 权 或 不 加 权 ， 这 一 切 都 取决 于 我 们 想 要 图 
(RMA 


在 图 10-5 中 ， 链 接 是 无 向 的 (没有 箭头 ) 。 假 设 这 里 的 链接 表示 
两 个 链接 的 节点 “认识 ”对方 〈 例 如 ， 达 娜 认识 卡拉 、 埃 文 和 弗兰克 ， 
而 本 只 认识 安娜 /“。 脸 书 的 朋友 图 也 是 无 向 的 ， 因 为 如 果 你 是 我 的 朋 
友 ， 那 么 我 一 定 也 是 你 的 朋友 。 我 们 在 第 8 章 看 到 的 学 生 之 间 的 共同 参 
与 图 也 是 如 此 。 与 此 相反 ， 推 特 的 关注 图 是 有 向 的 :即使 你 关注 了 最 
喜欢 的 音乐 家 ， 可 能 对 方 并 没有 关注 你 。 第 5 章 中 的 网 络 图 也 一 样 。 


图 10-5 我 们 用 于 计算 中 心性 的 无 向 社交 图 示例 


有 了 图 示 后 ， 我 们 如 何 衡量 每 个 节点 的 重要 性 ? 事实 上， 人们 已 
经 提出 了 许多 不 同 的 指标 。 在 这 里 ， 我 们 将 了 解 市 点 中 心性 的 三 个 第 
见 测量 标准 。 


简易 方法 : 程度 中 心性 


最 显而易见 的 标准 是 程度 中 心性 (degree centrality) ， 也 就 
是 连接 到 相关 节点 的 节点 数量 。 在 第 5 草 ， 我 们 计算 了 有 癌 网 络 图 的 入 
度 和 出 度 。 对 于 无 同 图 ， 两 者 没有 区 别 ， 所 以 问题 更 人 简单。 


图 10-5 中 的 度数 是 多 少 ? 安娜 的 度数 是 2: 她 是 本 和 卡拉 的 朋友 。 
本 的 度数 是 1: 他 只 是 安娜 的 朋友 。 卡 拉 、 达 娜 、 埃 文 和 弗兰克 的 度数 
分 别 为 3、3、3 和 和 2。 根据 这 一 标准 ， 我 们 将 卡拉 、 达 娜 和 埃 文 并 列 作 
为 最 重要 的 节点 ， 其 次 是 安娜 和 弗兰克 并 列 作为 第 二 重要 的 厄 点 ， 最 
后 是 本 ， 作 为 最 不 重要 的 节点 。 


这 个 排名 合理 吗 ? 我 们 同意 本 应 该 是 最 不 重要 的 : 他 唯一 的 联系 
是 安娜 。 我 们 也 可 以 认为 ， 达 娜 和 埃 文 的 重要 性 应 该 相同 ， 因 为 他 们 
连接 到 相同 的 人 。 


可 是 卡拉 呢 ? 她 提供 了 安娜 和 本 与 图 像 其 余部 分 唯一 的 连接 。 没 
有 她 ， 网 络 将 分 割 (partition) 成 两 组 ， 如 图 10-6 所 示 。 此 外 ， 没 
有 安娜 ， 本 将 不 会 连接 到 图 像 。 如 果 我 们 在 讨论 中 心性 ， 那 么 ， 既 然 
安娜 和 卡拉 对 图 像 的 连通 性 更 重要 ， 我 们 不 应 该 给 她 们 更 多 分 数 吗 ? 


图 10-6 
如 果 我 们 删除 卡拉 ， 那 么 安娜 和 本 将 不 再 连接 到 其 他 节点 。 这 应 该 能 多 少 证 明 卡 拉 的 中 
心性 


程度 中 心性 没有 考虑 到 的 另 一 点 ， 征 我 们 在 第 5 草 网 页 排序 中 看 到 
的 : 如 果 一 个 节点 连接 到 许多 重要 节点 ， 它 应 该 比 连接 到 许多 不 重要 
的 节点 更 为 重要 。 网 页 级 别 算法 《第 5 章 ) 通过 将 每 个 节点 的 重要 性 传 
播 到 其 近邻 ， 解 决 了 这 些 问题 。 我 们 也 可 以 在 这 里 应 用 这 个 方法 吗 ? 
确实 可 以 ， 而 且 这 古 个 你 可 以 目 己 做 得 不 错 的 练习 。 我 们 则 将 探索 在 
社交 图 中 定义 中 心性 的 其 他 方法 。 


统计 路 径 : 接近 中 心性 


我 们 的 第 二 个 重要 性 标准 一 -接近 中 心性 (closeness 
centrality) ， 着 眼 于 节点 到 其 近邻 的 距离 。 要 找到 这 一 距离 ， 我 们 
必须 考虑 图 中 两 个 节点 之 间 的 距离 ， 这 是 包含 它们 的 最 短路 径 

(shortest path) 中 的 链接 数 。 一 条 路 径 (path) 是 连接 节点 的 一 
系列 链接 ， 最 短路 径 则 是 利用 尽 可 能 少 的 连接 的 路 径 。 我 们 通常 用 从 


头 到 尾 通过 路 径 时 访问 的 节点 ， 来 表示 一 条 路 径 。 所 以 在 图 10-5 中 ， 
从 本 到 弗兰克 的 路 径 经 过 安娜 、 卡 拉 、 挨 文 ， 然 后 是 达 娜 ， 表 示 为 
(B，A，C，E，D，F) 。 这 条 路 径 的 长 度 是 5， 因 为 它 有 5 个 链接 
(我 们 将 在 第 12 章 和 第 14 章 探索 最 短路 径 算 法 ) 


除了 这 条 路 径 ， 还 有 其 他 从 本 到 弗兰克 的 途径 。 例 如 ， 我 们 可 以 
在 埃 文 之 前 访问 达 娜 (B，A，C，D，E,，F) 。 我 们 也 可 以 使 用 更 少 
的 链接 ， 因 为 没有 必要 同时 使 用 达 娜 和 埃 文 : (B，A，C,，D, F) 和 
(B，A，C，E，F) 分 别 只 有 4 个 链接 。 这 些 是 本 和 弗兰克 之 间 的 最 
三 路 径 ， 其 中 之 一 在 图 10-7 中 高 亮 显 示 。 


图 10-7 
注 : 本 和 弗兰克 之 间 最 短 的 路 径 之 一 是 (B，A，C，D，F) ， 长 度 为 4 


节点 的 接近 中 心性 是 基于 距离 其 他 每 个 节点 最 短路 径 长 度 的 平均 
值 。 接 近 中 心性 较 小 的 节点 往往 更 接近 其 他 方 点， 而 且 根 据 这 个 度量 
标准 更 为 重要 。 


让 我 们 为 卡拉 计算 接近 中 心性 。 首 先 ， 在 图 10-5 中 ， 我 们 需要 找 
到 她 和 其 他 节点 之 间 的 最 短路 径 : 


。 从 卡拉 到 本 的 最 短路 径 是 什么 ? 只 有 一 条 路 径 〈(C，A， 
B) ， 长 度 为 2。 


* 到 安娜 的 路 径 呢 ?最 短路 径 包 括 一 个 链接 (C，A) ， 长 度 为 


。 到 达 娜 的 呢 ? 最 短路 径 是 链接 (C，D) ， 长 度 为 1。 
。 到 埃 文 的 呢 ? 链接 (C，E) ， 长 度 为 1 。 


。 到 弗兰克 的 呢 ? 最短 路径 是 (C,， D, F) 和 (C, E, F)， 
长 度 为 2。 


你 可 以 在 图 10-8 中 看 到 这 些 距 离 的 概要 。 平 均值 是 多 少 ? 我 们 通 
过 将 这 些 距离 相 加 ， 再 除 以 总 数 (5) ， 得 出 平均 值 : 
六 十 1 守卫 十 1 寺 22 和 _ 


图 10-8 卡拉 5 的 最 短路 径 链 5 接 和 长 度 


答案 即将 揭晓 ， 除 了 一 个 小 细节 。 我 们 想 要 一 个 较 小 的 平均 值 
(而 不 是 更 大 ) ， 以 表示 更 高 的 中 心性 ， 表 明 该 人 距离 更 近 。 所 以 我 

们 采用 倒数 : 
] 


5 
7 了 15 一 了 = 0.714 


你 可 以 采取 同一 步 怠 ， 得 出 图 中 其 他 人 的 接近 中 心性 。 如 果 你 对 
达 娜 中 心性 的 具体 说 明 感 兴趣 ， 请 参考 本 书 网 站 Q10.1 部 分 。 以 下 是 计 
算 步 又 和 结果 的 摘要 : 


安娜 : 3 0.556 
本 : 0 
过 娜 ， 了 7737 了 于- 0.625 
埃 文 ， RS 
弗兰克 ; 0 


按照 接近 中 心性 来 看 ， 卡 拉 最 高 ， 其 次 是 达 娜 和 埃 文 (平分) ， 
然后 是 安娜 ， 之 后 是 弗兰克 ， 节 后 是 本 。 相 比 程度 中 心性 ， 很 多 平分 
都 被 打破 :卡拉 第 一 ， 安 娜 现在 比 弗 兰 元 高 。 卡 拉 和 安娜 对 图 像 连 通 
性 至 关 重 要 ， 这 说 明了 提高 她 们 分 数 的 合理 性 。 


接近 中 心性 非常 直观 : 接近 你 的 人 越 多 ， 你 对 网 络 的 中 心性 越 
高 。 这 是 我 们 能 取得 的 最 好 结果 吗 ? 有 人 会 说 ， 我 们 例子 中 的 排名 仍 
然 有 一 些 了 矛盾 之 处 。 第 一 ， 为 什么 安娜 不 如 达 娜 和 埃 文 重要 呢 ? 达 娜 
和 埃 文 真 的 不 像 安 娜 那样 ， 对 图 像 连 通 性 如 此 重要 ( 见 图 10-9) 。 其 
次 ， 为 什么 卡拉 的 接近 中 心性 只 比 达 娜 和 埃 文 的 稍 高 ? 她 对 图 像 连通 
性 要 重要 得 多 。 


图 10-9 
注 : 我 们 可 以 删除 达 娜 或 埃 文 ， 同 时 不 让 其 余 节 点 断 


男 一 个 中 心性 的 概念 同样 有 用 ， 也 许 能 比 接近 中 心性 更 加 符合 
种 直觉 。 


衡量 连通 性 : 中 介 中 心性 


假设 安娜 需要 通过 网 络 中 的 最 短路 径 ， 辐 弗兰克 传递 消息 。 人 参考 
图 10-10， 她 可 以 采取 两 条 路 线 : 


图 10-10 
注 : 如 果 安 娜 想 发 送 一 条 消息 给 弗兰克 ， 她 必须 把 它 发 给 卡拉 ， 而 卡拉 可 以 将 它 转 给 达 娜 或 
埃 文 


“ 告诉 卡拉 ， 卡 拉 告 诉 达 娜 ， 达 娜 告诉 弗 兰 元 ; 
， 告 诉 卡拉 ， 卡 拉 告 诉 埃 文 ， 埃 文告 诉 弗 兰 死 。 


无 论 哪 种 情况 ， 她 都 需要 告诉 卡拉 。 但 卡拉 有 两 种 可 能 的 选择 : 
她 可 以 选择 告诉 达 娜 或 埃 文 。 对 于 安娜 发 送 给 弗 兰 死 的 消息 ， 如 采 我 
们 要 分 配 重要 性 分 数 ， 应 该 怎么 做 ? 卡拉 可 能 得 到 最 高 分 数 ， 因 为 这 
两 条 路 径 都 涉及 她 。 两 条 路 径 中 ， 只 有 一 条 涉及 达 娜 或 埃 文 ， 所 以 他 
们 可 以 各 得 卡拉 的 一 半分 数 。 


男 一 个 例子 是 ， 如 采 本 想 给 达 娜 发 消息 起 么 办 ? 这 里 只 有 一 条 最 
短路 径 : 发 给 安娜 ， 安 娜 转发 给 卡拉 ， 卡 拉 转 给 达 娜 。 分 配 分 数 时 ， 


安娜 和 卡拉 可 能 得 到 相同 的 分 数 。 相 对 第 一 个 例子 中 给 卡拉 、 达 娜 和 
埃 文 的 分 数 ， 他 们 应 该 得 到 多 少 ? 以 前 有 两 条 路 径 都 是 可 能 的 ， 但 现 
在 只 有 一 条 ， 这 使 得 它 更 加 关键 。 没 有 安娜 或 卡拉 ， 本 无 法 给 达 娜 发 
送 消 筷 ， 同 样 ， 没 有 卡拉 ， 安 娜 无 法 给 弗兰克 发 送 消息 。 因 此 ， 安 娜 
和 卡拉 为 这 一 条 路 径 得 到 的 分 数 ， 可 能 和 之 前 卡拉 为 两 条 路 径 得 到 的 
同样 多 。 


基于 此 ， 当 一 个 和 点 位 于 网 络 中 其 他 节点 之 间 的 多 条 关键 路 径 中 
时 ， 中 介 中 心性 (betweenness centrality) 认为 其 更 加 重要 。 从 A 
到 B 的 最 短路 径 越 多 ， 每 条 路 径 对 于 另 一 个 节点 的 中 心性 就 越 低 ， 
为 每 条 路 人 径 对 于 这 对 广 点 都 不 太 重 要 。 如 果 从 A 到 B 有 3 条 最 短路 径 ， 
其 中 两 条 包含 C， 那 么 C 能 从 这 对 节点 得 到 多 少 分 数 ? 2/3。 在 我 们 的 
例子 中 ， 对 于 安娜 和 弗兰克 这 对 节点 来 说 ， 我 们 要 给 卡拉 2/2 (她 位 于 
两 条 路 径 中 ) ， 达 娜 和 埃 文 各 得 1 /2 (他们 位 于 其 中 一 条 路 人 径 中 ) 。 
对 于 本 和 达 娜 这 对 市 点 ， 安 娜 和 卡拉 将 分 别 获 得 1/1 (他 们 都 位 于 唯 
一 的 路 径 中 ) 。 


让 我 们 计算 卡拉 的 中 介 中 心性 。 在 开始 之 前 ， 我 们 先 扼 直觉 来 判 
断 一 下 ， 相 对 于 其 他 人 ， 她 的 中 心性 将 是 高 还 是 低 ? 估计 是 高 : 因为 
她 把 图 像 的 两 边 结合 在 一 起 。 你 可 能 在 目 己 的 社交 网 络 中 整 认识 这 样 
EW 


要 找到 卡拉 的 中 心性 ， 除 了 那些 与 卡拉 有 关 的 节点 ， 我 们 还 需要 
考虑 图 像 中 的 每 对 节点 。 在 这 样 做 时 ， 我 们 思考 两 个 问题 : 这 对 节点 
之 间 有 多 少 条 最 短路 径 ? 这 些 最 短路 径 中 有 多 少 包含 卡拉 ? 


。 安 娜 和 本 : 有 多 少 条 最 短路 径 ? 只 有 一 条 ， 链 接 (A，B) 。 
其 中 包含 卡拉 吗 ? 不 ， 所 以 她 得 到 0/1= 0 分 。 

。 安 娜 和 达 娜 ;有 多 少 条 最 短路 径 ? 一 条 (A，C，D) 。 其 中 
包含 卡拉 吗 ? 是， 她 得 到 1/1= 1 分 。 


。 安娜 和 埃 文 ， 还 是 有 一 条 最 短路 径 (A，C，E) 。 因 为 它 包 
含 卡拉 ， 她 再 次 得 到 1 /1= 1 分 。 

。 安娜 和 弗兰克 : 有 多 少 条 最 短路 径 ? 两 条 (A, C, D, FF) 
和 (A，C, E,，F) 。 有 多 少 条 包含 卡拉 ? 两 条 都 包含 ， 所 以 她 得 
到 2 人 二 于 二 


。 本 和 达 娜 : 有 一 条 最 短路 径 (B，A，C，D) 。 它 包含 卡 
拉 ， 所 以 她 得 到 1/1=1 分 。 

。 本 和 埃 文 : 还 是 只 有 一 条 最 短路 径 (B，A，C，E) ， 并 且 
包含 卡拉 ， 所 以 她 得 到 1/1= 1 分。 

。 本 和 弗兰克 : 有 多 少 条 路 径 ? 两 条 (B，A，C，D，F) 和 


(B，A，C，E，F) 。 因 为 两 条 都 包含 卡拉 ， 所 以 她 得 到 2/2=1 
分 。 


。 达 娜 和 埃 文 ， 达 娜 和 弗兰克 ， 挨 文 和 弗兰克 : 其 中 每 对 节点 
有 一 条 最 短路 径 (D, E) ， (D，F) 和 (E，F) 。 它 们 都 不 包含 
卡拉 ， 所 以 她 为 每 条 路 径 得 到 0 /1 =0 分 。 


这 些 数字 相 加 ， 得 到 卡拉 的 中 介 中 心性 : 
0+1+1+1+1+1+1+0+0+0=6 


你 可 以 为 其 他 节点 采取 同样 的 计算 过 程 。 如 果 你 对 达 娜 的 情况 感 
兴趣 ， 请 参考 本 书 网 站 Q10.2 部 分 。 经 过 计算 ， 安 娜 的 中 介 中 心性 是 4 
( 仅 次 于 卡拉 ) ， 埃 文 和 弗兰克 的 是 1.5 〈 并 列 第 三 ) ， 弗 兰 克 和 本 的 
是 0 (并 列 第 四 ， 他 们 不 在 任何 最 短路 径 上 ) 。 现 在 ， 卡 拉 是 迄今 为 目 
最 重要 的 入 点 ， 她 的 中 介 中 心性 比 安娜 高 1.5 倍 ， 比 达 娜 和 埃 文 出 4 
售 。 此 外 ， 安 娜 现在 比 达 娜 和 埃 文 更 重要 : 不 像 其 他 方法 ， 中 介 中 心 
性 考虑 到 安娜 对 图 像 连 通 性 的 页 献 。 


在 表 10-1 中 ， 你 可 以 看 到 我 们 在 这 个 例子 中 运用 的 不 同 中 心性 标 
准 概要 : 程度 、 接 近 和 中 介 。 我 们 也 可 以 加 入 网 页 级 别 的 重要 性 评 
分 。 采 用 哪 一 个 标准 取决 于 使 用 中 心性 标准 的 目标 。 基 本 论点 十 程 度 
中 心性 相当 人 简单， 而 接近 和 中 介 中 心性 产生 的 排名 更 符合 我 们 的 直 
觉 ， 而 且 更 能 体现 那个 被 认为 很 重要 的 人 的 庶 在 用 处 。 


表 10-1 

ge 程度 接近 中 介 
数值 排名 数值 排名 数值 排名 
安娜 2 第 二 0.39 第 五 4 第 二 
本 1 第 三 0.56 第 三 0 第 四 
卡拉 3 第 一 0.71 第 一 6 第 一 
达 娜 3 第 一 0.63 第 三 1.5 第 三 
埃 文 3 第 一 0.63 第 三 lS 第 三 
弗兰克 2 第 二 0.46 第 四 0 第 四 


注 : 本 例子 中 使 用 的 不 同 中 心性 标准 概要 分 别 是 程度 、 接 近 和 中 介 


通过 传播 产生 社会 影响 


让 我 们 记 住 中 心性 的 概念 ， 然 后 继续 第 9 章 对 影响 模型 的 讨论 ， 这 
次 会 考虑 到 社交 图 像 。 我 们 将 看 到 ， 一 个 人 的 社会 关系 如 何 影 响 他 采 
用 某 个 产品 或 项 目 。 


考虑 图 10-11 中 的 网 络 ， 其 中 有 8 个 市 点 连接 到 中 间 的 节点 。 关 于 
其 是 否 已 经 采用 某 个 产品 、 服 务 或 项 目 ， 每 对 相 邻 节点 有 两 种 状 
态 : “Y"” 表 示 是 ,“N” 表 示 否 。 处 于 “Y” 状 态 的 4 个 世 点 是否 会 产生 足够 
的 社会 影响 ， 以 致 中 心 节 点 翻转 ( 即 采 用 该 项 目 ) 呢 ? 


图 10-11 
注 ， 中心 节点 的 4 个 链接 已 切换 (“Y”) ， 男 外 4 个 没有 “(“N”) 


要 理 清 头 绪 ， 可 以 假设 你 是 位 于 中 心 的 那个 人 ， 相 邻 节 点 是 你 的 
亲密 朋友 ， 有 些 人 最 近 购买 了 最 新 的 苹果 手机 (“Y”) ， 其 他 人 没有 
(“N”) 。 可 以 想象 ， 你 看 到 拥有 它 的 人 越 多 (假设 他 们 满意 ) ， 这 
对 你 的 影响 就 越 大 ， 你 束 越 可 能 也 想 买 一 个 。 有 没有 办 法 让 我 们 知 
道 ， 你 最 后 到 发 会 不 会 跟风 ? 


一 个 典型 的 模式 是 为 每 个 节点 设置 一 个 翻转 阀 值 (flipping 
threshold) 。 这 是 某 个 节点 翻转 之 前 ， 其 近邻 需要 翻转 的 比例 。 在 
图 10-11 中 ， 中 心 季 点 50% (4/8) 的 近邻 已 经 翻转 。 所 以 ， 如 果 他 的 
冰 值 低 于 50%， 他 也 会 得 到 这 个 项 目 ， 但 如 果 阔 值 更 高 ， 那 么 他 就 不 
会 ， 因 为 这 个 项 目 没有 足够 的 社会 影响 力 。 例 如 ， 如 果 他 的 阐 值 是 
80%， 他 将 需要 至 少 7 个 朋友 已 经 获得 该 项 目 (因为 7/8>0.8， 但 6/8 
不 是 ) 


实际 上 ， 翻 力 靖 值 很 难 估计。 这 取决 于 很 多 不 同 的 因 和 又， 束 像 第 9 
章 引 发 信息 瀑布 需要 一 定 的 人 群 规模 那样 。 其 中 一 个 因 又 是 项 目 本 
身 : 例如 ， 更 便宜 和 更 具 吸 引力 的 产品 往往 会 降低 赋值 。 另 一 个 因素 
征 个 人 : 鲍 牵 可 能 相对 容易 动 播 ， 只 要 一 两 个 朋友 这 样 做 ， 他 驶 会 跟 
风 ， 而 爱丽 丝 可 能 永远 不 会 动 播 。 还 有 儿 个 网 络 因素 ， 如 人 与 人 之 间 
的 社会 天 系 的 力量 ， 以 及 链接 代表 的 含义 。 对 于 我 们 的 目的 而 言 ， 我 
们 假设 知道 翻转 国 值 ， 并 且 它 对 于 图 中 每 个 斑点 都 是 相同 的 。 


让 我 们 考虑 图 10_12 中 包含 8 个 人 的 社交 图 。 查 理 已 经 翻转 ， 而 其 
他 人 都 没有 。 假 设 阔 值 为 50%， 图 像 将 如 何 随时 间 变 化 ? 这 个 过 程 被 
称 为 传染 (contagion) ， 在 另 一 个 理想 化 的 模型 中 它 将 这 样 展开 。 


安娜 查理 伊 天 乔治 


本 达 娜 “弗兰克 ， 汉 娜 


图 10-12 包含 8 个 节点 的 社交 图 ， 用 于 说 明 传播 问题 


注 : 你 可 以 将 其 看 成 一 群 人 购买 某 个 产品 。 最 初 ， 查 理 拥有 该 产品 ， 并 实现 “翻转 ”， 而 其 他 
人 没有 


第 一 步 


在 每 一 个 时 间 点 ， 我 们 对 所 有 人 逐个 检查 ， 看 他 们 的 翻转 阔 值 是 
否 达到 ， 如 果 是 ， 我 们 切换 到 *Y”。 


“ 安娜: 最 初 ， 她 的 一 个 近邻 出 现 翻转 (查理 ) ， 而 另 一 个 没 
有 ( 达 娜 /。 她 会 翻转 吗 ? 既然 正好 有 50%， 这 就 证 明 安 娜 获得 了 
足够 的 社会 影响 ， 所 以 她 会 翻转 。 


“ 本 : 他 的 近邻 中 有 多 少 人 翻转 了 ? 一 个 (查理 ) ， 而 另 一 个 
没有 (〈 达 娜 》: 50% 足 够 了 ， 所 以 他 会 翻转 。 


“ 达 娜 : 达 娜 怎么 样 ? 这 有 点 儿 坏 手 ， 因 为 我 们 刚刚 确定 ， 她 
的 两 个 近邻 将 翻转 。 但 是 ， 这 直到 这 一 轮 才 会 发 生 : 此 时 ， 她 的 近 
邻 都 没有 翻转 。 由 于 影响 为 0%， 她 也 不 会 翻转 。 


。 伊 英 : 她 的 一 个 近邻 翻转 了 (查理 ) ， 而 另外 4 个 没有 。 她 
受到 多 少 影响 ? 11/5， 或 20%。 由 于 这 低 于 50%， 因 此 不 足以 导致 
翻转 。 


“ 弗 兰 元 、 和 乔治 和 汉 娜 : 他 们 的 近邻 都 没有 翻转 。 


生成 的 图 如 图 10-13 所 示 。 
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图 10-13 第 一 步 后 的 传播 


第 二 步 


现在 情况 如 何 ? 下 一 步 使 用 更 新 后 的 图 像 (图 10-13) : 


“ 达 娜 ， 她 的 两 个 近邻 (安娜 和 本 ) 已 经 翻转 ， 另 外 两 个 没有 
(伊美 和 弗兰克 ) : 50% 的 影响 足够 她 实现 翻转 。 


“ 伊 天 、 弗 兰 殴 、 乔 治 和 汉 娜 : 情况 没有 改变 。 
在 图 10-14 中 ， 你 可 以 看 到 第 二 次 和 欠 代 结束 时 ， 每 个 世 点 的 状态 。 


网 络 的 左 半边 已 经 翻转 ， 而 右 半 边 没 有 。 我 们 古 否 有 机 会 让 每 个 人 部 
最 终 翻转 ? 让 我 们 看 看 。 
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图 10-14 第 二 步 后 的 传播 


第 三 步 
现在 情况 如 何 ? 


。 伊 鞭 : 她 的 两 个 近邻 已 经 翻转 ， 其 他 3 个 还 没有 ， 影 响 为 
40%。 不 足以 实现 翻转 。 


。 弗 兰 克 : 他 的 一 个 近邻 已 经 翻转 ， 另 外 3 个 还 没有 。 影 啊 为 
25%。 影 响 还 是 不 够 。 


“ 乔治 和 汉 娜 : 他 们 的 近邻 仍然 都 没有 翻转 。 


因此 ， 没 有 节点 在 第 三 步 改变 状态 。 为 什么 会 这 样 ? 因为 每 一 个 
节点 都 有 太 多 没有 翻转 的 近邻 ， 却 没有 足够 已 经 翻转 的 近邻 。 在 伊 
芙 、 弗 兰 克 、 乔 治 和 汉 娜 中 ， 伊 美 连接 至 <Y” 状 态 的 比例 最 高 ， 而 她 
能 得 到 的 影响 仅 为 409%。 换 名 话说， 这 4 个 节点 形成 了 一 个 不 能 从 外 部 
渗透 的 社会 集群 (cluster) 〈 见 图 10-15) 。 


芷 YA 

伊 大 乔治 

弗兰克 汉 娜 

图 10-15 
注 : 伊 甘 、 弗 兰 克 、 乔 治 和 汉 娜 的 集群 过 于 密集 ， 外 部 社会 力量 无 法 渗透。 伊 英 有 60% 的 连 
接 在 集群 内 ， 弗 兰 克 有 75%， 乔 治 和 汉 娜 为 100% 

更 一 般 地 说 ， 任 何 彼此 之 间 有 连接 的 节点 群 都 可 以 称 为 集群 。 以 

一 个 集群 的 未 翻转 节点 为 例 ， 如 果 其 中 每 个 节点 内 部 都 有 太 多 近邻 ， 


就 不 可 能 对 其 产生 影响 。 如 果 你 有 兴趣 了 解 如 何 确定 集群 的 密度 
(density) ， 请 参考 本 书 网 站 Q10.3 部 分 。 


战略 宫 销 ， 最 大 限度 地 扩大 集体 影响 力 


你 能 看 到 传播 和 战略 营销 之 间 的 联系 吗 ? 其 目的 是 ， 通 过 一 开始 
选择 合适 的 人 来 宣传 产品 ， 最 大 限度 地 增加 会 购买 我 们 产品 的 人 数 。 
在 图 10-14 中 ， 我 们 已 经 接触 到 一 半 的 人 。 


我 们 可 以 采取 什么 措施 来 让 更 多 人 翻转 ? 如 果 我 们 了 解 社交 图 并 
信任 传播 模型 ， 会 有 一 些 可 能 性 。 一 个 是 符 试 降低 翻转 靖 值 : 如 有 果 国 
值 下 降 ， 即 使 只 是 减少 几 个 和 点 ， 我 们 也 会 有 更 好 的 机 会 在 某 个 时 间 
影响 所 有 人 。 男 一 种 选择 是 笑 试 打破 集群 。 如 采 我 们 以 某 种 方式 从 内 
部 切断 社会 关系， 我 们 可 以 更 容易 地 从 外 部 渗透 它们 。 或 者 可 以 笑 试 
在 集群 内 发 展 节 点 ， 从 内 部 产生 社会 影响 。 


这 些 选 择 中 哪些 是 可 行 的 ? 调整 阐 值 会 要 求 我 们 改变 人 们 的 喜 
好 ， 而 打破 联系 则 要 求 改变 社会 关系。 这 些 都 是 宫 销 公司 可 能 无 法 控 
制 的 因素 。 另 一 种 方法 是 ， 看 我 们 征 否 可 以 癌 集 群 内 的 节点 文 付 报 
酬 ， 使 其 采用 该 产品 。 回 到 图 10-14， 例 如 ， 选 择 发 展 伊 芙 、 乔 治 、 弗 
兰 克 或 者 汉 娜 中 的 任何 一 人 ， 痢 可 以 达到 这 一 目的 。 


更 一 般 地 说 ， 假 设 每 个 人 都 能 受到 一 定数 额 金钱 的 有 影响。 据 推 
测 ， 那 些 更 有 影响 力 的 节点 将 需要 花 更 多 的 钱 。 (例如 ， 一 家 设计 公 
司 可 能 会 付 给 一 个 名 人 一 大 笔 钱 ， 让 他 穿 上 其 品牌 的 衣服 。) 在 总 预 
算 的 约束 下 ， 我 们 应 该 发 展 哪个 万 总 以 实现 平衡 状态 下 最 大 程度 的 翻 
转 ， 同 时 最 大 限度 地 减少 达到 这 种 平衡 所 需 的 时 间 ? 


这 又 是 一 个 很 难 回 答 的 问题 。 如 采 我 们 能 像 第 9 章 的 顺序 决策 那 
样 ， 找 到 一 种 方法 来 触发 正 反 馈 ， 结 果 会 很 棒 : 我 们 发 展 的 节点 将 影 
啊 其 他 市 点 实现 翻转 ， 产 生 足 够 的 有 影响， 使 更 多 市 点 发 生 翻 加， 庆生 
更 大 的 影响 ， 以 此 类 推 。 如 采 我 们 只 能 发 展 一 个 节点 ， 也 许 应 该 根据 
某 个 中 心性 标准 ， 选 择 最 重要 的 一 个 节点 ? 这 并 不 总 是 一 个 稳 甩 的 做 


法 。 当 我 们 可 以 发 展 多 个 节点 时 ， 情 况 会 变 得 更 加 复 杀 。 一 般 来 说 ， 
我 们 不 想 选 择 最 中 心 的 节点 。 我 们 的 目标 是 ， 选 择 那 些 “ 组 合 ” 影 响 力 
最 大 的 六 点 。 


以 我 们 在 图 10-5 中 最 初 包含 6 个 节点 的 社交 图 为 例 。 根 据 接近 和 中 
介 中 心性 来 看 ， 卡 拉 都 古 最 重要 的 。 如 采 我 们 最 初 选择 发 展 卡 拉 ， 结 
果 会 怎样 ? 经 过 两 个 时 间 步 ， 我 们 将 使 三 个 节操 翻转 ， 安 娜 、 本 和 卡 
拉 。 但 我 们 能 做 得 更 好 吗 ? 是 的 ， 有趣 的 是 ， 无 论 是 发 展 达 娜 还 是 埃 
文 ， 都 将 导致 所 有 节点 在 5 个 步 又 后 翻转 ! 这 些 中 心性 标准 并 不 总 是 符 
合 最 大 化 影响 ， 这 使 得 对 于 发 展 证 点 的 选择 ， 很 难 找到 一 个 有 效 的 解 
决 方案 。 


如 果 我 们 可 以 选择 发 展 两 个 市 点 呢 ? 也 许 我 们 会 想 ， 那 吏 根 据 中 
介 中 心性 选择 最 重要 的 两 个 节点 : 卡拉 和 安娜 。 这 样 会 发 生 什么 ? 其 
实 并 不 会 和 只 发 展 卡拉 的 结果 相差 太 大 。 那 么 ， 是 否 存在 一 组 两 个 节 
点 ， 会 导致 整个 网 络 的 翻转 速度 比 只 发 展 达 娜 和 效 文 更 快 ? 是 的 ， 试 
想 当 我 们 发 展 安娜 和 达 娜 时 的 情况 ， 如 图 10-16 所 示 : 


图 10-16 
注 : 如 果 我 们 发 展 安娜 和 达 娜 ， 整 个 网 络 将 在 这 两 步 后 翻转 


一 步 以 后 ， 我 们 能 让 所 有 人 翻转 ， 除 了 埃 文 。 
* 两 步 以 后 ， 埃 文 也 翻转 ， 所 以 我 们 达到 了 目标 。 


同样 ， 基 于 中 心性 的 选择 并 不 总 十 最 好 的 策略 。 重 要 的 是 ， 要 确 
保 我 们 选择 的 节点 拥有 最 大 的 集体 影响 并 不 古 一 件 容易 的 事 ， 特 别 是 
在 可 能 包含 数 十 亿 节 点 的 真实 在 线 社交 网 络 中 。 


在 本 书 的 这 一 部 分 ， 我 们 研究 了 和 人们 受到 他 人 决策 影响 的 情 
况 ， 比 如 在 观看 视频 和 购买 产品 上 。 我 们 看 到 了 基于 人 口 模 型 的 信 
轧 瀑布 是 如 何 产生 的 ， 同 时 ， 这 部 分 还 揭示 了 为 什么 一 些 YouTube 视 
频 出 现 病毒 式 传 播 ， 而 其 他 的 却 没有 。 人 然后 我 们 结合 网 络 拓扑 ， 研 
完 如 何 识 别 和 利用 在 脸 书 和 推 等 等 社交 网 络 乎 台 上 有 影响 力 的 人 。 


这 里 的 首要 主题 与 第 三 部 分 的 原则 相反 。 面 对 社会 影响 ， 人 们 
的 行为 变 得 相互 依赖 ， 商 黎 了 群众 智慧 背后 的 基本 假设 。 当 人 们 遵 
人 循 彼此 的 依赖 时 ， 他 们 束 会 将 信息 传播 给 大 从 ， 即 使 它 是 不 正确 
Ns 


第 五 部 分 
分 而 治之 


在 对 前 四 条 网 络 原 则 的 讨论 中 ， 我 们 多 次 提 到 互联 网 。 前 儿 章 
讨论 的 大 部 分 话题 都 依赖 于 它 的 存在 。 当 提 到 它 时 ， 你 可 能 会 想 ， 
完 竟 什么 是 互联 网 ? 它 是 如 何 设计 、 建 造 和 管理 的 ? 本 书 的 第 五 部 
分 和 第 六 部 分 主要 关于 这 些 问 题 。 剩 下 的 两 条 原则 包含 互联 网 的 一 
些 关 键 方面 。 


在 这 一 部 分 ， 我 们 将 看 到 互联 网 是 如 何以 可 扩展 的 方式 进行 设 


计 和 管理 的 。 随 着 连接 设备 数量 和 互联 网 规模 不 断 扩大 ， 可 扩展 性 
几乎 在 所 有 意义 上 都 成 为 必须 。 我 们 将 在 第 11 划 看 到 ， 它 需要 一 种 
共享 网 络 资源 的 有 效 方法 ， 以 及 对 管理 责任 的 划分 (无 论 是 在 地 理 
上 还 是 功能 上 ) 使 各 个 部 分 可 以 更 容易 操作 。 然 后 ， 在 第 12 章 ， 我 
们 将 看 到 互联 网 的 不 同 子 网 如 何 完 成 重要 任务 ， 以 可 扩展 的 方式 将 
言 思 从 一 点 传递 到 另 一 点 ， 分 之 ， 而 后 治之 。 


第 11 章 
发 明 互 联网 


作为 不 同 网 络 的 网 络 ， 互 联网 不 但 是 一 项 非凡 的 技术 和 巨大 的 商 
业 成 束 ， 还 体现 了 重要 的 工程 设计 理念 。 我 们 开始 后 面 三 章 的 旅程 ， 
但 不 是 介绍 某 种 技术 ， 而 是 介绍 三 个 重要 的 设计 理念 ， 它 们 使 互联 网 
获得 极 大 的 可 扩展 性 : 分 组 交换 、 分 布 式 层次 结构 ， 以 及 模块 化 。 


回顾 分 至 


你 还 记得 在 本 书 的 第 一 部 分 ,我们 谈 到 了 资源 共 至 吗 ? 我 们 研究 
了 不 同 的 使 用 户 能 够 共 至 网 络 资源 的 多 址 访问 技术 。 不 同 频 率 、 不 同 
时 间 和 (或 ) 不 同 代码 传输 ， 都 是 常用 的 划分 通信 介质 的 方法 。 


通过 从 手机 到 YouTube 服 务 器 的 网 络 ， 如 果 我 们 把 资源 分 配给 你 
和 其 他 所 有 人 ， 所 有 传输 都 将 沿 着 自己 的 路 径 ， 从 头 到 尾 被 区 分 。 像 
这 样 的 电路 交换 式 (Circuit-switched) 网 络 属于 给 每 个 用 户 按 固 
定 比 例 分 配 资源 的 网 络 组 。 


你 能 想到 电路 交换 可 能 是 低 效 的 情况 吗 ? 互联 网 数据 应 用 的 突 发 
性 质 如 何 处 理 ， 如 了 网页、 电子 邮件 和 文件 传输 ? 在 这 些 情况 下 ， 并 非 
所 有 的 网 络 资源 都 会 不 断 使 用 ， 因 为 这 些 传输 发 生 在 很 多 的 短 时 间 
内 。 当 普通 用 户 不 需要 专用 货源 时 ， 为 什么 不 让 他 们 共享 这 些 资源 
呢 ? 


我 们 可 以 混合 并 匹配 分 属 不 同 互 联网 会 话 的 信息 ， 使 其 分 享 路 
径 。 这 就 是 分 组 交换 (packet switching) 的 本 质 ， 把 要 发 送 的 信 
息 分 成 更 小 块 的 数据 包 。 每 个 会 话 可 能 穿 过 多 个 路 径 ， 并 且 每 个 链接 
由 来 自 不 同 会 话 的 数据 包 共 享 。 


竞 什么 是 互联 网 会 话 (session) ? 这 是 两 个 或 两 个 以 上 通过 
ee ,交换 或 对 话 。 当 会 话 建立 时 ， 资 源 遍 布 
从 通信 路 径 一 端 (发 送 者 ) 到 另 一 端 (接收 者 ) 的 整个 路 径 。 一 个 会 
话 可 以 有 多 个 来 源 〈 即 发 送 者 ) 和 多 个 目的 地 ( 即 接收 者 ) ， 但 我 们 
关注 包含 一 个 发 送 者 和 一 个 接收 者 的 单 播 (unicast) 会 话 。 


在 图 11-1 中 ， 你 可 以 看 到 分 组 交换 和 电路 交换 的 区 别 。 在 电路 交 
换 中 ， 每 个 电路 可 以 占据 一 个 特定 的 频带 ， 或 一 组 专用 的 时 际 。 在 分 
组 交换 中 ， 则 没有 专用 电路 。 


一 a 
发 送 者 ?2 电路 交换 

发 送 者 1 分 组 交换 

| 数据 包 


CT] 


ce 记 


发 送 者 2 
图 11-1 
注 : 在 电路 交换 (上 图 ) 中 ， 每 两 个 会 话 沿 着 链接 各 有 一 个 专用 资源 (在 这 种 情况 下 是 时 
间 ) 。 在 分 组 交换 (下 图 ) 中 ， 每 个 会 话 将 其 消息 分 成 数据 包 ， 并 在 数据 包 到 达 时 发 送 。 路 
径 沿 着 所 有 时 除 和 频率 共享 


互联 网 的 演变 


20 世 纪 60 年 代 以 前 ， 通 信和 网 络 主要 基于 电路 交换 。 互 联网 的 演变 
人 于 20 世 纪 六 七 十 年 代 ， 以 分 组 交换 作为 网 络 基 本 范式 的 出 现 为 标 
志 。 让 我 们 花 几 分 钟 时 间 ， 来 探讨 一 下 这 个 转变 是 如 何 发 生 的 。 同 
时 ， 这 将 疝 你 介绍 互联 网 背后 的 另外 两 个 重大 理念 一 一 分 布 式 层次 结 
构 和 分 层 。 


阿 由 网 


20 世 纪 60 年 代 中 期 ， 美 国 高 级 研究 计划 署 (简称 ARPA) 对 创建 
一 个 基于 分 组 交换 的 大 型 网 络 很 感 兴趣 。 到 20 世 纪 60 年 代 林 ，ARPA 
已 经 制订 好 了 一 项 将 永远 改变 我 们 生活 的 计划 。 


1969 年 ，ARPA 和 BBN 技 术 公 司 签订 合同 ， 来 研发 可 以 支持 其 计 
划 的 计算 机 (接口 通信 处 理 机 ) 。 配 备 了 这 些 机 器 后 ， 加 州 大 学 洛 杉 
矶 分 校 (UCLA) 、 斯 坦 福 大 学 、 加 州 大 学 圣 塔 芭 芭 拉 分 校 

(UCSB) 、 犹 他 大 学 共同 组 合 出 分 组 交换 网 络 的 第 一 代 原型 ， 后 来 
被 称 为 阿 帕 网 (ARPANET) 。 同 年 10 月 29 日 ，“lo” 成 为 通过 阿 帕 
网 发 送 的 第 一 条 文本 消息 ， 它 从 加 州 大 学 洛杉矶 分 校 发 送 至 斯 坦 福 。 
实际 上 ， 程 序 员 原 打算 发 送 “ 登 录 ” (login) 一 词 ， 但 是 由 于 编码 错 
误 ， 在 前 两 个 字母 发 送 后 ， 系 统 朋 误 了 ， 设 计 团 队 在 一 小 时 后 才 将 其 


修复 。 


阿 帕 网 迅速 发 展 1970 年 3 月 ， 它 延伸 至 美国 东海 岸 的 马萨诸塞 州 
坎 布 里 奇 ， 到 6 月 ， 有 9 台 机 器 互相 连接 : 到 12 月 ， 有 13 台 ; 到 次 年 9 
月 ， 网 络 共有 18 个 站 点 。 你 可 以 在 图 11-2 中 看 到 当时 连接 主机 的 分 布 
。1975 年 ， 阿 帕 网 正式 宣告 运行 ， 此 时 它 已 发 展 到 约 60 台 机 器 。 


图 11-2 
注 : 阿 帕 网 在 1971 年 9 月 的 分 布 图 ， 显 示 出 最 初 的 18 台 主机 。MIT 表 示 麻 省 理工 学 院 ，SDC 表 


示 系 统 开发 公司 ，SRI 表 示 斯 坦 福 研 究 所 ，UCLA 表 示 加 州 大 学 洛杉矶 分 校 ，UCSB 表 示 加 州 
大 学 圣 塔 区 芭 拉 分 校 

大 约 在 这 个 时 候 ， 罗 伯 特 . 卡 恩 和 温 顿 . 琴 夫 〈 见 第 五 部 分 和 第 六 部 
分 对 他 们 的 采访 ) 发 表 了 一 篇 具有 里 程 碑 意义 的 论文 ， 这 篇 文章 详细 
介绍 了 他 们 开发 的 分 组 交换 网 络 的 全 新 协议 (protocol) 。 协 议 本 质 
上 是 设备 用 来 互相 沟通 的 一 套 规则 ， 规 定 了 它们 使 用 的 共同 “ 语 
言 ”( 我 们 在 第 2 章 讨论 了 Wi-Fi 随 机 访问 协议 ) 。 这 套 协 议 被 称 为 传输 
控制 协议 /网 际 协议 ， 简 称 TCP/IP， 并 通过 分 组 交换 网 络 上 的 端 到 端 
控制 进行 ， 为 连接 阿 帕 网 中 的 主机 提供 了 一 种 可 扩展 的 方式 。 重 要 的 
是 ， 当 大 量 不 同 设备 被 添加 到 或 从 网 络 中 删除 时 ， 该 协议 不 需要 修 
改 ， 这 使 大 规模 的 互 操作 性 和 连通 性 成 为 可 能 。 大 约 在 10 年 后 的 1983 
年 ，TCP/IP 取 代 了 阿 帕 网 的 最 初 协议 。 


TCP/IP 也 催生 了 一 个 重要 理念 ， 将 互联 网 需要 执行 的 任务 划分 为 
不 同 功 能 层 。 一 层 可 以 在 不 影响 男 一 层 协议 操作 的 情况 下 改变 。 作 为 


互联 网 背后 的 一 个 基本 理念 ， 我 们 将 在 本 章 后 面 的 模块 化 部 分 详细 讨 


NSFNET 网 络 


20 世 纪 80 年 代 中 期 以 前 ， 资 金 和 授权 问题 使 许多 组 织 无 法 连接 到 
阿 由 网。 在 这 个 时 候 ， 美 国 国家 科学 基金 会 (NSF) 接管 其 研发 工 
作 ， 目 标 是 创造 一 个 学 术 研 究 网络 ， 使 科学 家 能 访问 全 美 大 型 计算 中 
心 。 从 1985 年 到 1995 年 ， 美 国 国家 科学 基金 会 资助 创建 和 运行 了 一 个 
不 断 发 展 的 被 称 为 NSFNET 网 络 的 网 络 之 网 络 。 


如 图 11-3 所 示 ，NSFNET 网 络 建立 在 三 层 结构 中 ， 其 中 每 种 类 型 
的 节点 (校园 、 区 域 和 主干 ) 本 身 都 是 网 络 。 校 园 网 通过 区 域 网 连接 
在 一 起 ， 区 域 网 通过 主干 网 相 结 合 ， 将 NSFNET 网 络 锋 在 一 起 。 主 干 
网 首先 延伸 至 全 美国 ， 后 来 发 展 到 其 他 国家 。 


图 11-3 NSFNET 网 络 的 三 层 网 络 之 网 络 


随 着 更 多 网 络 提 供 商 的 加 入 ，NSFNET 网 络 不 断 发 展 。 为 了 满足 
不 断 增长 的 需求 ， 主 干 的 规模 〈 即 组 成 主干 的 节点 数量 ) 和 速度 ( 即 


连接 节点 的 链接 速度 ) 必须 在 不 同时 间 有 所 改进 。1986 年 主干 有 6 个 节 
点 ， 链 接 速度 达到 56 kbps (56 000 比 特 / 秒 ) 。 到 1991 年 主干 已 经 扩展 
到 14 个 节点 ， 链 接 速 度 为 1.5 Mbps (150 万 比特 / 秒 ) 。 在 图 11-4 中 ， 你 
可 以 看 到 ， 当 时 的 网 络 连接 已 经 变 得 非常 密集 和 丰富 了 。 


图 11-4 1991 年 美国 的 NSFNET 网 络 示意 图 
注 : 主干 节点 以 粗 线 绘制 在 顶部 ， 而 区 域 网 络 在 地 图 上 被 标 出 


NSFNET 网 络 以 研究 和 教育 的 名 义 拨 球 ， 用 于 科学 和 工程 目的 。 
严格 地 说 ， 它 不 允许 被 用 于 商业 活动 (参考 本 书 网 站 Q11.1 部 分 ， 了 解 
部 分 相关 政策 ) 。 这 种 情况 很 快 就 改变 了 。 随 着 需求 的 增加 ， 在 20 世 
纪 90 年 代 早 期 ， 一 些 互联 网 服务 提供 商 (ISP) 出 现 ， 它 们 将 互联 网 扩 
展 至 公共 用 途 (我 们 在 第 3 章 谈 到 ， 互 联网 服务 供应 商 基于 数据 使 用 向 
用 户 收 费 ) 。 商 业 利益 和 企业 活动 极 大 地 扩展 了 这 个 相互 关联 的 网 络 
之 网 络 。 到 1994 年 ， 作 为 用 户 界面 的 万 维 网 和 网 络 浏览 器 已 经 成 熟 ， 


世界 各 地 很 快 着 手 开发 在 网 络 上 运行 的 商业 应 用 程序 ， 电 子 邮 件 、 文 
件 共 吾 、 浏 览 网 页 ， 应 有 尽 有 。 


1995 年 ，NSFNET 网 络 正 式 退 役 ， 并 被 商业 互联 网 取代 。 在 接 下 
来 的 20 年 里 ， 互 联网 成 为 我 们 日 常生 活 中 必 不 可 少 的 一 部 分 ， 世 界 各 
地 联网 的 人 和 设备 数量 每 年 都 在 迅速 增长 ， 这 要 部 分 归功 于 技术 进步 
和 可 扩展 的 分 而 治之 的 设计 原则 。2005 年 ， 在 家 上 网 的 人 数 达 到 10 
亿 ，2010 年 达到 20 亿 ，2014 年 达到 30 亿 。2014 年 ， 世 界 上 已 有 大 约 120 
亿 台 互联 网 连接 设备 ， 这 表示 全 世界 平均 每 个 人 拥有 1.7 台 设备 。 随 着 
物 联网 〈Internet of Things， 简 称 IoT) 蓬勃 发 展 ， 到 2020 年 ， 这 
两 个 数字 预计 将 增加 三 倍 ， 即 有 330 亿 台 设 备 ， 每 人 4.3 台 。 


了 解 互联 网 演变 的 简 史 后 ， 我 们 现在 看 看 三 个 关键 的 建构 理念 。 
首先 回 到 之 前 提 到 的 分 组 交换 。 


分 组 和 电路 


专用 资源 和 共 至 资源 分 配 之 间 的 争论 由 来 已 和信。 电路 交换 或 专用 
资源 分 配 有 一 个 很 大 的 优势 :保证 质量 。 每 个 会 话 都 有 专门 的 电路 。 
正 因为 如 此 ， 吞 吐 性 能 (成 功 传递 消息 的 速率 ) 和 延迟 性 能 (传递 一 
条 消息 所 需 的 时 间 ) 都 可 以 得 到 保证 。 


与 此 相反 ， 分 组 交换 网 络 中 的 会 话 可 以 彼此 共享 路 径 。 任 何 一 个 
会 话 的 流量 也 可 以 被 分 配 到 不 同 路 径 。 一 条 消息 的 不 同 部 分 可 以 不 按 
顺序 到 达 目 的 地 (接收 器 可 以 重新 排序 ， 而 路 径 中 的 链接 会 变 得 拥 
挤 。 吞 吐 和 延迟 性 能 变 得 不 确定 。 面 对 这 种 不 确定 性 ， 互 联网 声称 将 
提供 最 大 努力 的 〈best-effort) 服务 ， 这 表示 它 将 尽 最 大 努力 ， 以 
高 性 能 来 传递 信息 。 不 过 ， 这 一 点 没有 任何 保证 ， 也 许 对 其 更 准确 的 
措 述 是 并 没有 努力 去 保证 性 能 。 


但 是 分 组 交换 有 了 两 大 优势 。 首 和 完 ， 它 提供 了 连接 的 便利 性 ， 不 需 
要 为 每 个 会 话 搜 索 、 建 立 和 维护 并 到 端的 资源 。 网 络 不 必 确 保 你 的 资 
源 为 你 保存 ， 你 也 不 必 等 得 资源 保存 。 只 要 遵循 互联 网 协议 ,设备 束 
可 以 随意 传输 。 


第 二 个 优点 是 可 扩展 性 。 我 们 已 经 看 到 ， 在 很 多 情况 下 ， 可 扩展 
性 是 网 络 的 一 个 重要 性 质 ， 从 文 持 单元 中 的 数 百 个 用 户 间 的 功率 控制 
(第 1 章 ) ， 到 在 巨大 的 网 络 图 中 迅速 运行 网 页 级 别 《第 5 章 ) ， 再 到 
从 大 规模 在 线 课程 中 获得 有 效 的 社会 化 学 习 《第 8 章 ) 。 在 这 种 情况 
下 ， 可 扩展 性 是 指 分 组 交换 网 络 承担 大 量 不 同 会 话 的 能 力 ， 有 的 会 话 
寺 续 时 间 短 ， 其 他 的 叉 会 很 长 。 


分 组 交换 如 何 获 得 可 扩展 性 ? 答案 是 ， 通 过 对 网 络 资源 的 高 效 利 

用 实现 。 是 什么 使 它 如 此 高 效 ? 有 两 个 “秘方 *， 首 先是 统计 多 工 

(statistical multiplexing) : 许多 会 话 可 以 共享 一 条 路 径 和 路 径 上 

的 资源 。 其 次 是 资源 池 (resource pooling) ， 这 是 对 统计 多 工 的 补 
充 : 一 个 会 话 可 以 使 用 许多 路 径 。 让 我 们 对 其 进行 详细 讨论 。 


使 更 大 的 变 得 更 好 : 统计 多 工 


在 分 组 交换 网 络 中 ， 在 每 条 占用 其 中 所 有 资源 的 路 径 上 ， 不 只 
一 个 会 话 。 由 于 会 话 没有 专用 资源 ， 所 以 它们 在 空间 时 不 会 汇 费 任何 
资源 。 其 他 在 空 几 期间 有 需求 的 会 话 可 以 使 用 任何 未 使 用 的 资源 。 


看 看 图 11-5。 在 某 些 时 除 ， 爱 丽 丝 的 需求 比 鲍 靳 高 得 多 。 在 电路 
交换 中 ， 每 个 会 话 会 分 配 到 不 同 的 时 际 ， 每 个 都 会 保持 在 其 电路 中 ， 
这 束 会 导致 鲍 盈 分 配 到 的 许多 时 阶 补 浪费。 分 组 交换 允许 爱丽 丝 填补 
这 个 空 几 时 间 。 只 要 还 有 末 满 足 的 需求 ， 束 有 可 供应 的 资源 。 


爱丽 丝 


鲍 动 
图 11-5 

注 : 在 线路 交换 网 络 中 ， 鲍 勃 的 部 分 专用 时 隙 将 在 他 需求 低 时 被 少 费 。 在 分 组 交换 中 ， 多 个 
会 话 可 以 使 用 相同 的 资源 ， 人 允许 爱丽 丝 填补 鲍 勃 的 多 余 供应 

在 第 一 部 分 ， 我 们 用 鸡尾酒 会 的 比喻 来 说 明 不 同 的 多 址 访问 技 
术 。 如 果 每 个 人 在 同一 个 房间 里 轮流 发 言 ( 即 共享 一 条 路 径 ) ， 当 轮 
到 其 中 一 组 ， 他 们 却 没 有 什么 要 说 的 时 候 ， 会 发 生 什么 ? 在 电路 交换 
中 ， 什 么 都 不 会 发 生 ， 而 且 将 出 现 一 个 静默 期 ， 在 此 期 间 ， 其 他 人 项 
望 可 以 填补 死 区 时 间 。 分 组 交换 将 通过 统计 多 工 ， 人 避免 浪费 时 间 。 


使 更 大 的 变 得 更 好 : 资源 池 


一 个 会 话 还 可 以 使 用 多 个 路 径 ， 在 分 组 交换 网 络 中 传输 信息 。 在 
突 发 流量 的 情况 下 ， 演 示 货 源 池 的 效率 可 能 会 相当 复业 ， 但 基本 理念 
直截了当 : 与 其 拥有 两 套 资 源 ， 如 两 条 孤立 的 链 授 ， 不 如 把 它们 合并 
起 来 ， 将 其 作为 一 个 大 的 资源 使 用 。 


看 看 图 11-6。 有 两 个 会 话 和 两 条 链接 。 在 某 个 时 间 ， 爱 丽 丝 有 很 
高 的 需求 ， 需 求 不 能 被 顶部 链接 上 可 用 的 容量 满足 。 相 反 ， 在 此 期 
间 ， 鲍 勃 在 底部 链接 有 较 低 需求 和 较 低 链接 利用 率 。 通 过 将 两 个 链接 
案 合 成 一 个 更 大 的 资源 池 ， 网 络 束 能 够 满足 爱丽 丝 在 这 段 时 间 内 部 分 
剩余 的 突 发 需求 〈 哪 人 不 能 全 部 满足 。 在 将 路 径 作 为 共享 资源 而 不 
征 专用 电路 时 ， 分 组 交换 采用 货源 池 。 


爱丽 丝 


-NN 
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而 过 


图 11-6 

注 : 在 某 个 时 间 ， 有 过 丽 丝 的 需求 超出 顶部 链接 可 以 满足 的 范围 ， 而 鲍 勃 的 需求 比 底部 链接 的 
容量 少 得 多 。 在 分 组 交换 中 ， 这 两 个 链接 被 看 作 是 一 个 汇集 的 资源 ， 人 允许 爱丽 丝 的 一 些 消息 
通过 底部 链接 传输 

再 次 回 到 鸡尾酒 会 的 比喻 。 假 设 有 两 个 房间 ( 即 两 个 链接 ) ， 每 
个 房间 内 有 10 对 人 人 交谈。 这些 房间 都 很 小 ， 所 以 相当 不 舒服 和 拥挤 。 
然后 ， 在 其 中 一 个 房间 ， 有 6 对 人 决定 离开 。 这 个 房间 里 剩 下 4 对 人 ， 
男 一 间 里 有 10 对 人 。 分 组 交换 将 平衡 每 个 房间 的 需求 ， 让 拥挤 房间 里 
的 3 对 人 换 到 较 宽 松 的 房间 ， 以 缓解 拥堵 。 电 路 交换 将 这 些 房 间 视 为 两 
个 独立 的 资源 ， 不 会 试图 将 会 话 从 一 个 房间 转 到 男 一 个 。 


图 11-7 总 结 了 我 们 已 经 讨论 的 分 组 交换 和 电路 交换 市 给 网 络 的 三 
个 关键 区 别 。 归 根 结 原 ， 相 比 保证 质量 ， 对 于 互联 网 来 说 ， 容 易 提供 
连接 和 为 许多 不 同 用 户 进行 扩展 的 能 力 更 具 吸 引力 ， 不 过 人 们 直到 21 
世纪 初 才 完全 明日 这 一 点 。 质 量 保证 固然 不 错 ， 但 另外 两 个 特性 对 于 
互联 网 这 样 的 大 型 动态 网 络 也 必 不 可 少 。 一 旦 网 络 以 简单 和 可 扩展 的 
方式 发 展 ， 我 们 就 可 以 寻找 其 他 的 解决 方案 ， 以 应 对 质量 的 变化 。 


特性 


质量 保证 x 
连接 便利 性 4 
可 扩展 性 4 


图 11-7 分 组 交换 与 电路 交换 在 三 个 重要 网 络 特性 方面 的 区 别 


分 布 式 层次 结构 : 空间 划分 


所 以 ， 分 组 交换 非常 适合 处 理 动态 、 突 发 的 流量 。 然 而 ， 管 理 这 
样 的 网 络 是 相当 复杂 的 ， 有 如 下 几 个 原因 。 一 个 显而易见 的 问题 是 互 
联网 的 规模 ， 我 们 说 过 ， 使 用 互联 网 的 人 数 已 经 十 分 庞大 。 


与 此 相关 的 是 ， 互 联网 已 经 延伸 到 地 球 上 几乎 每 一 个 角落 。 许 多 
不 同 的 互联 网 服务 供应 商 已 经 出 现在 世界 各 地 ， 每 个 都 拥有 和 人 负责 隐 
络 的 不 同 部 分 。 任 何 给 定 的 端 到 端 网 络 会 话 都 可 能 穿越 多 个 供应 商 之 
间 的 链接 。 例 如 ， 一 个 从 谷歌 到 你 的 苹果 手机 的 YouTube 会 话 将 通过 
一 个 无 线 传输 界面 ， 然 后 《如果 你 没有 连接 到 Wi-Fi) 可 能 通过 蜂 宽 网 
络 核 心 的 儿 个 链接 ， 之 后 是 穿越 不 同 供应 商 的 一 系列 更 多 的 链接 。 


每 个 供应 商 位 于 整体 层次 结构 的 不 同 级 别 。 这 些 级 别 以 类 似 于 
NSFNET 网 络 结构 的 形式 分 布 : 有 三 个 不 同 的 层次 ， 如 图 11-8 所 示 。 


图 11-8 互联 网 将 互联 网 服务 提供 商 (ISPs) 分 为 不 同 层次 


注 : 一 级 互联 网 服务 提供 商都 互相 连接 ， 组 成 互联 网 的 主干 。 其 中 每 个 一 级 提供 商都 连接 到 
多 个 二 级 提供 商 ， 二 级 提供 商 又 连接 到 三 级 提供 商 
在 第 一 层 中 ， 有 一 些 非常 大 的 供应 商 ， 称 为 一 级 互联 网 服务 供 
应 商 (tier-1 ISPs) 。 每 个 一 级 供应 商都 覆盖 全 球 ， 它 们 可 以 不 经 过 
较 低 级 别 就 到 达 其 他 一 级 供应 商 。 这 意味 着 它们 形成 了 同 级 
(peering) 关系 ， 并 可 以 通过 彼此 的 流量 。 一 级 供应 商 的 全 部 网 络 
有 了 时 也 称 为 互联 网 主干 网 ， 就 像 NSFNET 网 络 一 样 。 这 样 的 例子 包括 
AT&T、 威 瑞 森 、 英 国电 信 、 三 级 通信 和 日 本 电报 电话 公司 。 


在 第 二 层 ， 更 多 覆盖 部 分 地 区 的 供应 商 成 为 二 级 互联 网 服务 供 
应 商 (tier-2 ISPs) 。 它 们 也 可 能 在 彼此 之 间 形 成 同 级 关系 ， 但 无 法 
不 通过 其 一 级 供应 两 束 到 达 互 联网 主干 网 。 当 一 个 二 级 供应 商 和 一 级 


供应 商 进 行 连接 ， 两 者 形成 客户 -供应 商 (customer-provider) 关 
系 ， 二 级 供应 商 需要 向 一 级 供应 商 付费 ， 以 使 其 流量 通过 。 


最 后 ， 每 个 二 级 供应 商 向 许多 三 级 互联 网 服务 供应 商 (tier-3 
ISPs) 提供 连接 ， 形 成 另 一 种 类 型 的 客户 -供应 商 关 系 。 三 级 供应 商 
只 和 客户 产生 流量 往来 ， 和 其 他 供应 商 则 没有 。 例 如 ， 学 校 、 企 业 和 
农村 地 区 的 住宅 互联 网 服务 供应 商 属 于 这 个 类 别 。 


每 个 供应 商 和 互联 网 上 的 相关 行政 单位 形成 一 个 自治 系统 
(autonomous system) ， 简 称 AS。 截 至 2014 年 年 中 ， 在 整个 互联 
网 上 有 超过 45 000 个 自治 系统 ， 而 2008 年 年 底 时 仅 有 30 000 个 。 这 是 互 
联网 规模 之 大 和 地 理 分 布 之 广 的 另 一 个 例子 。 事 实 上 ， 处 理 保 持 在 自 
治 系统 内 部 〈 简 称 系统 内 ) 的 互联 网 流量 ， 和 处 理 穿越 两 个 或 两 个 以 
上 自治 系统 〈 简 称 系统 间 ) 的 流量 大 不 相同 。 让 每 个 自治 系统 管理 自 
己 的 流量 ， 是 一 种 通过 在 空间 上 分 配 控制 ， 扩 展 互联 网 的 方法 。 


也 不 是 所 有 的 通信 都 必须 通过 整个 网 络 。 在 物 联网 和 沉浸 式 人 工 
智能 应 用 的 推动 下 ， 比 如 说 ,模糊 (fog) 结构 正 准备 使 计算 、 存 
储 、 控 制 和 通信 更 接近 最 终 用 户 。 


模块 化 ， 功 能 划分 


互联 网 的 复杂 性 来 目 它 的 规模 及 其 需要 处 理 的 许多 任务 规模 。 它 
需要 通过 网 络 传递 消息 、 控 制 拥塞 、 运 行 应 用 程序 、 建 立会 话 以 及 执 
行 许多 其 他 功能 。 如 何 管 理 所 有 这 些 任务 ” 当 设 计 制 造 如 此 复杂 的 系 
统 时 ， 目 然 要 将 功能 模块 化 ， 即 将 其 分 割 成 可 以 单独 管理 的 更 小 的 碎 
J se 


堆 琶 协议 ， 用 分 层 进 行 分 解 


模块 化 网 络 任务 产生 所 谓 的 分 层 协议 栈 (layered protocol 
stack) 。 协 议 栈 中 的 每 一 层 都 有 不 同 用 途 ， 负 责 可 以 共同 管理 的 不 
同 功能 集 。 


图 11-9 显 示 了 一 个 典型 的 与 互联 网 相关 的 协议 栈 。 这 里 有 5 个 层 

级 : 物理、 链接、 网络、 传输 和 应 用 。 它 们 从 底部 到 顶部 被 称 为 第 1 层 

(物理 ) 至 第 5 层 (应 用 ) ， 每 一 层 都 会 使 用 下 层 提 供 的 服务 ， 又 反 过 
来 为 上 层 提 供 服务 。 


图 11-9 


注 : 与 互联 网 相关 的 典型 协议 栈 ， 由 5 个 层级 组 成 〈(IP: 互联 网 协议 ，TCP: 传输 控制 协议 ; 
UDP: 用 户 数据 报 协议 。) 


让 我 们 有 具体 看 看 这 个 协议 栈 。 在 底部 是 物理 层 和 链接 层 ， 即 1 和 
2 。 物 理 层 (physical layer) 处 理 信 号 在 网 络 介质 上 的 传输 。 这 种 
介质 可 以 是 铜 线 、 光 纤 电 缆 、 无 线 接口 等 。 链 接 层 (link layer) 反 
过 来 管理 设备 对 网 络 介质 的 访问 。 它 表现 得 像 一 个 附近 的 交通 警察 ， 
为 争夺 进入 道路 〈 即 链接 ) 的 双方 进行 仲裁 。 例 如 ， 我 们 在 第 一 部 分 
看 到 的 功率 控制 和 随机 访问 就 是 在 这 些 层 上 运行 的 功能 。 


在 中 间 是 网 络 层 和 传输 层 ， 即 3 和 4: 


.网络 层 (network layer) 负责 逐 跳 和 逐 链接 路 由 。 它 使 用 
的 协议 是 IP。 路 由 的 重要 功能 发 生 在 这 层 ， 这 一 点 我 们 将 在 第 12 章 
讨论 。 

. 传输 层 (transport layer) 主要 管理 端 到 端的 会 话 ， 使 用 
TCP 作 为 其 主要 协议 。 我 们 将 在 第 13 章 了 解 拥塞 控制 ， 这 是 该 层 处 
理 的 重要 功能 。 


在 顶部 是 应 用 层 (application layer) ， 即 5。 作 为 互联 网 的 最 
终 用 户 ， 这 层 对 于 我 们 最 显而易见 。 本 书 中 讨论 的 许多 网 络 都 是 由 我 
0 网 络 、 电 子 邮件 、 移 动 应 用 程序 、 内 容 
。 上 和 目 20 世 纪 90 年 代 以 来 ， 这 一 层 的 一 个 共同 协议 是 超 文 本 传输 

即 HITP， 这 是 万 维 网 的 基础 。 


正如 我 们 所 说 ， 每 一 层 都 为 上 层 提 供 服务 ， 并 使 用 下 层 的 服务 。 
例如 ， 传 输 层 4 为 上 面 运行 应 用 的 第 5 层 提 供 端 到 闻 连 接 ， 提 供 会 话 建 
立 、 数 据 包 重 新 排序 和 拥塞 控制 的 服务 。 反 过 来 ， 传 输 层 从 它 下 面 的 
网 络 层 3 获 取 服 务 ， 包 括 通过 路 由 建立 的 连接 。 


在 互联 网 发 展 的 简短 历程 中 ， 物 理 媒 介 的 传输 速度 已 经 提高 了 30 
000 倍 以 上 ， 从 32 Kbps 的 拨号 上 网 到 10 Gbps 的 光纤 和 100 Mbps 的 无 线 
网 络 。 互 联网 上 运行 的 应 用 程序 ， 已 经 从 适合 专业 人 士 的 用 于 文件 传 


输 〈 现 在 仍然 有 它们 的 一 席 之 地 ) 的 命令 行 工具 ， 发 展 到 适合 消费 者 
的 网 站 ， 如 网 飞 和 推 符 。 然 而 ， 互 联网 本 和 映 经 过 这 些 不 可 思议 的 转 
变 ， 仍 然 继续 运行 ， 这 在 很 大 程度 上 要 归功 于 TCP/IP 协 议 ， 因 为 在 应 
用 程序 和 通信 媒体 变化 时 ， 它 仍然 大 体 保持 不 变 。 


图 11-9 中 的 水 平 线 是 指 各 层 之 间 的 边界 。 它 们 实际 上 有 是 非常 复杂 
的 对 象 ， 表 示 对 每 一 层 可 以 做 什么 、 能 看 到 什么 以 及 负责 什么 的 限 
制 。 这 些 边界 也 十 不 明确 的 ， 因 为 各 层 之 间 出 现 了 一 些 功 能 重合 。 一 
个 典型 的 例子 是 误 关 控制 ， 它 虽 在 检测 和 处 理 传输 中 的 错误 。 每 一 层 
都 执行 一 定量 的 该 任务 。 重 倒是 故意 制造 的 ， 产 生 的 功能 见 余 有 助 于 
确保 稳健 性 ， 同 时 允许 网 络 通过 分 层 结 构 发 展 。 


根据 协议 楼 划分 任务 ， 互 联网 可 以 随 着 功能 集 的 增长 而 扩展 ， 管 
理 每 一 层 。 


面向 连接 和 无 连接 


你 可 能 已 经 注意 到 ， 我 们 在 本 章 开 始 介绍 TCP 和 IP 时 ， 将 它们 并 
称 为 TCP/IP。 如 果 它 们 是 在 不 同 的 层 中 使 用 ， 为 什么 要 这 样 称呼 ? 事 
实 上 ， 互 联网 的 初始 版 本 将 TCP/IP 作 为 一 个 单独 的 协议 ， 管 理 逐 跳 路 
由 和 端 到 端的 会 话 。 根 据 分 层 和 模块 化 的 原则 ， 在 20 世 纪 80 年 代 初 ， 
TCP 和 IP 正 式 分 为 两 部 分 ， 分 别 服务 传输 层 和 网 络 层 。 


在 这 两 层 之 间 ， 人 们 已 经 做 出 了 许多 有 趣 的 建构 决策 。 传 输 层 负 
责 端 到 端的 管理 ， 存 TCP 中 是 面向 连接 的 《connection- 
oriented ) ， 而 网 络 层 负责 逐 跳 管理 ， 在 中 中 是 无 连接 的 

(connectionless) 。 你 可 以 在 图 11-10 中 看 到 这 个 区 别 。 这 种 责任 
划分 意味 着 ， 网 络 层 不 关心 链接 的 拥塞 或 负载 情况 。 这 时 就 需要 传输 
层 来 解决 ，TCP 在 这 种 情况 下 ， 负 责 管理 终端 主机 的 需求 。 
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图 11-10 


注 : 传输 层 (第 4 层 ， 见 图 11-9) 负责 端 到 端的 会 话 管理 ， 而 网 络 层 (第 3 层 ) 负责 逐 跳 管 理 


面向 连接 和 无 连接 通信 之 间 的 差异 ， 也 可 以 通过 类 比 电话 和 邮寄 
信件 (图 11-11) 来 理解 。 如 果 你 打 电 话 给 某 人 ， 在 你 开始 和 对 方 交 谈 
之 前 ， 他 必须 得 知 你 在 打 电 话 (电话 铃 响 ， 并 拿 起 听 简 。 这 样 ， 你 
在 通话 之 前 就 与 对 方 建立 起 连接 。 相 反 ， 想 想 当 你 给 茶 人 写 信 时 会 发 
生 什么 。 途 中 每 一 个 收 到 信 的 中 间 邮 局 只 关心 它 接 下 来 去 哪里 ， 而 不 
征 它 来 目 哪 里 或 者 最 终 应 该 到 哪里 。 它 只 使 用 最 终 目 的 地 来 确定 路 径 
上 的 下 一 跳 。 在 这 个 无 连接 的 过 程 中 ， 收 信人 甚至 可 能 不 知道 这 封 信 
正在 途中 。 我 们 将 在 第 12 章 讨论 路 由 系统 时 ， 回 到 这 个 邮政 系统 的 类 
Le 


面 回 连接 无 连接 
图 11-11 
注 : 打 电 话 和 邮寄 信件 类 似 于 面向 连接 和 无 连接 通信 


模块 化 的 开销 


我 们 提 到 在 互联 网 上 发 送 的 东西 时 ， 经 常 使 用 “消息 ”这 个 词 ， 如 
电子 邮件 和 即时 消息 等 。 从 技术 上 讲 ， 消 息 (message) 是 应 用 层 产 
生 数 据 的 基本 单位 。 一 条 消息 被 传送 前 ， 协 议 栈 中 的 每 层 会 在 上 面 添 
加 自己 的 头 信 息 (header) ， 这 样 网 络 中 每 个 节点 的 协议 栈 各 层 可 
以 解读 其 相应 的 头 信息 。 从 顶部 的 第 5 层 开 始 ， 一 直到 第 1 层 ， 以 下 是 
将 数据 封装 (encapsulated) 传输 的 过 程 : 


第 5 层 : 当 某 个 互联 网 用 户 想 要 发 送 消 息 时 ， 他 的 设备 让 应 用 
层 生 成 一 个 要 传输 的 消息 序列 。 

第 4 层 : 每 个 消息 在 传输 层 被 划分 成 段 (segment) 。 每 段 
包含 两 部 分 ， 有 效 载荷 (payload) ， 这 是 来 自 消 息 的 部 分 实际 
内 容 以 及 在 前 面 添 加 一 个 第 4 层 头 信息 的 有 效 载 傈 。 


第 3 层 : 然后 各 段 被 传递 到 网 络 层 ， 对 方 将 其 划分 并 封装 为 数 
据 报 或 数据 包 (packet) 。 每 个 数据 包 前 面 都 有 一 个 第 3 层 的 头 
守 息 。 


百 , 己 ， 


第 2 层 : 每 个 数据 包 被 进一步 传递 到 链接 层 ， 对 方 添加 一 个 第 
2 层 头 信息 ， 以 形成 一 个 帧 。 


第 1 层 : 最 后 ， 所 有 帧 都 传递 到 物理 层 ， 作 为 比特 传输 。 


你 可 以 在 图 11-12 中 看 到 这 个 过 程 。 


图 11-12 


注 : 协议 栈 中 的 各 层 将 自己 的 头 信息 添加 到 消息 中 ， 在 互联 网 上 传输 之 前 将 其 封装 


计算 机 、 路 由 器 、 调 制 解 调 颖 、 服 务 器 等 网 络 中 的 不 同 设备 运行 
分 层 协议 栈 的 不 同 子 集 。 每 一 个 设备 都 将 解 封 (decapsulate) ”( 即 
解码 ) 并 读 取 与 其 运行 的 头 信息 相关 的 子 集 。 如 果 它 是 路 径 上 的 中 间 
节点 ， 它 将 再 次 封 狼 这 些 层 并 继续 发 送信 息 。 在 图 11-13 中 可 以 发 现 一 
些 重要 的 情况 : 


智能 手机 交换 机 路 由 器 服务 需 


图 11-13 不 同 网 络 元 素 处 理 协 议 栈 中 的 不 同 层 
. 计算 机 和 服务 器 作为 终端 主机 ， 处 理 所 有 的 五 层 。 
。 路 由 器 (router) 作为 网 络 级 别 设备 ， 处 理 到 第 3 层 。 这 就 
要 求 它们 拥有 并 处 理 IP 地 址 。 
。 交 换 机 (switch) 作为 链接 层 设备 ， 只 处 理 到 第 2 层 。 它 们 
并 不 拥有 或 处 理 IP 地 址 。 


封 狐 可 能 看 起 来 不 从 要 而 多 余 。 这 样 说 是 对 的 ， 这 个 过 程 会 产生 
控制 开销 (overhead) ， 这 是 分 层 架 构 中 众多 元 余 和 开销 的 一 种 ， 
因为 网 络 中 发 送 的 大 量 数据 不 是 实际 内 容 。 那 么 ， 为 什么 一 开始 要 在 
层 里 添加 头 信息 昵 ? 这 是 一 种 对 分 组 交换 网 络 中 不 同 传输 进行 区 分 和 
提供 信息 的 方式 ， 比 如 它们 来 目 哪 里 ， 要 去 哪里 ， 以 及 传输 多 久 。 例 
如 ， 第 3 层 的 头 信息 包含 源 和 目的 耳 地 址 ， 这 (我 们 将 在 第 12 章 中 看 
到 ) 对 于 互联 网 的 路 由 任务 是 必 不 可 少 的 。 同 样 ， 通 过 允许 所 有 人 共 
享 相同 的 网 络 资 源 ， 分 组 交换 可 以 取得 比 电路 交换 更 高 的 效率 ， 但 我 
们 需要 区 分 传输 目 身 内 部 的 不 同 会 话 。 


分 组 交换 、 分 布 式 层 次 结构 和 分 层 是 互联 网 背后 的 三 个 基本 概 
念 。 它 们 使 互联 网 实现 有 效 扩展 ， 以 满足 更 高 的 需求 ， 实 现 更 广泛 的 
地 理 分 布 ， 以 及 处 理 更 多 的 功能 。 但 我 们 的 探索 才刚 刚 开 始 。 管 理 不 
断 扩 大 的 网 络 之 网 络 涉及 许多 任务 : 我 们 必须 型 清楚 如 何 从 A 点 到 B 
上 护 ， 管 理 链接 中 的 拥塞 ， 等 等 。 我 们 在 图 11-8 中 对 目 治 系统 的 讨论 是 
到 下 一 章 的 恰当 过 疲 ， 接 下 来 我 们 将 关注 目 治 系统 内 部 路 由 。 


第 12 章 
路 由 流量 


流量 是 如 何 通 过 互联 网 ， 从 一 个 地 方 到 达 另 一 个 地 方 的 ? 一 个 简 
短 的 答案 是 网 络 中 包含 称 为 路 由 器 的 设备 ， 控 制 数据 包 的 传输 方向 。 
用 通俗 的 语言 解释 ， 互 联网 上 的 路 由 (routing) 类似 于 你 开车 前 往 
某 处 时 ， 其 目的 是 确定 你 会 遵循 哪 条 路 线 。 在 研究 确定 数据 包 路 由 的 
方法 之 前 ， 让 我 们 先 来 看 一 看 主要 概念 。 


Dt 


— 
Ls 


SS 


互联 网 的 “邮政 服务 ” 


正如 我 们 之 前 看 到 的 ， 交 通 网 络 可 以 为 通信 网 络 提供 有 用 的 类 
比 ， 邮 政 服务 则 为 互联 网 路 由 提供 了 有 趣 的 类 比 。 要 提供 发 送 者 到 接 
收 者 的 路 由 ， 我 们 需要 三 个 主要 功能 ， 寻 址 、 路 由 和 转发 。 有 时 这 二 
个 术语 在 非 正式 表达 中 被 混为一谈 ， 但 它们 其 实 古 不 同 的 步 又 。 


寻 址 


当 你 邮递 信件 时 ， 需 要 在 信封 上 写 下 地 址 (图 12-1) 。 和 否则 ， 邮 
政局 就 不 知道 该 脏 么 处 理 这 封 信 。 你 把 收 件 人 的 街道 地 址 、 城 镇 、 
州 、 国 家 名 称 和 邮政 编码 写 在 前 面 ， 告 诉 邮局 应 该 把 信 投 递 到 哪里 。 
你 把 你 的 地 址 也 写 在 信封 上 ， 这 样 信 的 来 源 束 清 楚 了 ， 同 时 万 一 路 上 
出 现 什 么 问题 也 有 用 。 


鲍 孝 ， 中 密斯 
六 定 路 7 号 i i 
谢 润 高 地 ， NJ 07303 收 信 人 标识 


爱丽 丝 . 约翰 进 Wi 


水 景 道 81 号 
瑞 思 平原 ，GA 30005 


图 12-1 
注 : 在 信封 上 写 地 址 ， 通 过 邮政 系统 发 送 ， 类 似 于 为 消息 写 上 地 址 ， 通 过 互联 网 发 送 


收 件 人 的 邮政 地 址 给 了 他 一 个 独特 的 标签 ， 这 是 世界 上 没有 其 他 
人 共享 的 (除了 住 在 同一 个 房子 里 的 人 ) ， 所 以 关于 你 希望 把 信 寄 到 
哪里 这 个 问题 ， 没 有 含混 不 清 的 地 方 。 这 也 是 互联 网 的 寻 址 方式 : 我 
们 给 网 络 中 的 每 个 节点 贴 上 唯一 的 标签 ， 这 样 我 们 就 可 以 识别 消息 的 
来 源 和 目的 地 。 特 别 是 ， 每 个 网 络 设备 都 会 被 分 配 一 个 互联 网 协议 地 
址 ， 即 IP 地 址 (IP address) 。IP 地 址 通常 表示 为 用 点 分 开 的 小 
数 ， 例 如 127.12.5.88， 数 字 介 于 0 和 255 之 间 。 


在 图 12-2 中 ， 你 可 以 看 到 一 些 家 中 常见 的 互联 网 设备 ， 其 中 有 些 
常常 会 被 分 配 IP 地 址 。 第 11 划 曾 提 到 ， 调 制 解 调 絮 等 一 些 设备 不 使 用 
互联 网 协议 进行 通信 ， 因 此 不 需要 分 配 IP 地 址 。 


127.12.3.89 


无 了 127.12.5.87 


互联 网 调制 解 调 般 路 由 天 


笔记 本 电脑 


127.12.3.88 


台式 电脑 


图 12-2 网 络 设备 被 分 配 称 为 IP 地 址 的 唯一 标识 符 


IP 有 两 个 版 本 ， 版 本 4 和 版 本 6。IPv4 的 地 址 使 用 四 组 数字 (例如 
127.12.5.88) ， 可 以 分 配 超过 40 亿 个 有 效 地 址 。 和 截至 2011 年 年 初 ，40 
亿 个 地 址 已 经 不 够 用 。IPV6 的 地 址 被 设计 为 使 用 相当 于 16 组 数字 ， 提 
供 40 亿 x40 亿 x40 亿 x40 亿 个 有 效 地 址 。 这 听 起 来 似乎 太 大 而 没有 必要 

(如 第 9 章 提 到 的 64 位 YouTube 浏 览 计数 器 ; ， 但 随 着 互联 网 连接 设备 
的 扩散 ， 这 已 被 证 明 是 一 个 明智 的 选择 ， 特 别 是 考虑 到 这 些 地 址 将 被 
分 配 到 物 联 网 中 。 


让 我 们 深入 了 解 一 下 邮政 系统 的 类 比 。 与 邮寄 地 址 的 邮政 编码 将 
信 送 达 特 定 的 城镇 或 城市 相似 ，IP 地 址 前 缀 (prefix) 将 互联 网 信息 
送 达 目的 路 由 器 。 对 于 IPv4 地 址 ， 最 左边 的 3 个 数字 可 能 表示 前 级 (不 
过 它 可 能 更 长 或 更 短 ) 。 它 由 一 条 斜 杠 标 出 : 127.12.5.0/24， 这 表示 该 
地 址 的 前 缀 是 127.12.5。 为 什么 24 可 以 代表 前 3 个 数字 ? 通常 ， 卫 地址 
的 长 度 用 表示 它们 的 字 节 数 来 表示 。 在 这 个 例子 中 ， 每 个 数 占 8 个 字 
方 ， 所 以 3 个 数 占 24 个 字 节 。 


使 用 目的 IP， 路 由 将 消息 传递 给 具有 相同 前 缀 的 设备 组 。 这 个 组 
被 称 为 子 网 (subnet) 。 前 级 后 的 数字 提供 子 网 内 的 特定 主机 标识 
符 (host identifier ) 。 例 如 ， 图 12-2 中 的 每 台 设 备 都 在 子 网 
127.12.5.0/24 中 ， 主 机 ID 分 别 为 87Y、88 和 89。 在 邮件 系统 中 ， 我 们 可 
以 说 ， 所 有 共享 你 的 邮政 编码 的 房屋 都 在 你 的 “ 子 网 中， 而 你 的 街道 
地 址 则 是 你 的 “主机 标识 符 *”。 更 多 关于 子 网 、 前 级 和 主机 地 址 的 信 
晨 ， 请 参考 本 书 网 站 Q12.2 和 Q12.1 部 分 。 


终端 用 户 设备 通常 不 会 有 固定 的 静态 耳 地 址 。 通 滑 ， 卫 地 址 会 被 
自动 分 配 并 租用 一 段 时 间 。 这 项 服务 由 动态 主机 配置 协议 (简称 
DHCP) 服务 器 提供 ， 向 设备 提供 相关 的 人 P 地 址 信息 (图 12-3) 
DHCP 服 务 器 跟踪 各 个 I1P 地 址 目 由 获得 的 信息 。 你 的 设备 与 它 联 系 ， 吕 ® 
会 获得 当前 未 被 使 用 的 IP 地 址 有 限 的 租价 时 间 。 当 租约 到 期 时 ， 可 以 
续 约 ， 否 则 服务 器 会 将 其 返还 到 地 址 池 ， 以 便 其 他 设备 使 用 。 
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图 12-3 


注 : 动态 主机 配置 协议 (DHCP) 服务 器 负责 将 互联 网 协议 〈IP) 地 址 租赁 给 设备 。 它 跟踪 本 
地 数据 库 中 尚未 分 配 的 可 用 地 址 


有 时 ， 在 本 地 网 络 中 给 你 的 设备 分 配 的 IP 地 址 与 其 他 网 络 所 看 到 
的 不 同 。 例 如 ， 你 在 大 学 校园 内 的 笔记 本 电脑 地 址 可 能 与 外 部 世界 看 
到 的 不 同 。 网 络 地 址 转换 (简称 NAT) 路 由 器 负责 地 址 的 来 回转 换 ， 
它 会 让 本 地 之 外 的 人 们 可 以 根据 你 的 公共 下地 址 (图 12-4) 对 你 的 设 
备 进 行 寻 址 。 你 可 以 把 NAT 看 成 公司 大 楼 里 的 收发 室 : 当 一 个 包 囊 要 
被 投递 给 公司 里 的 某 个 人 ， 邮 有 递 系 统 根据 大 楼 的 地 址 〈 即 公共 IP) 将 
它 送 到 那里 。 然 后 ， 收 发 室 里 的 分 件 人 〈 即 NAT 路 由 器 ) 根据 该 人 的 
姓名 ( 即 私 有 IP) 来 确定 将 其 放 进 谁 的 邮箱 ， 或 放 在 谁 的 桌 上 。 
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图 12-4 
主 ， 有 时， 你 的 公共 互联 网 协议 (IP) 地 址 与 私人 IP 地 址 不 同 。 网 络 地 址 转换 (NAT) 路 由 


器 和 避 丙 车 之 癌 的 伟 括 
路 由 
正常 进行 寻 址 后 ， 下 一 步 是 决定 消息 到 达 目 的 地 所 选择 的 路 径 。 
在 邮政 系统 中 ， 例 如 ， 从 新 泽 西 的 普林斯顿 到 佛罗里达 的 迈 阿 


密 ， 路 由 提前 决定 信件 将 经 过 哪些 中 间 城 市 。 信 件 从 普林斯顿 的 地 方 
邮局 发 出 ， 可 能 会 转移 到 新 泽 西 某 地 的 一 座 大 型 区 域 邮局 ， 然 后 转 到 


佛罗里达 某 地 的 一 座 大 型 邮局 ， 再 到 收 件 人 所 在 的 地 方 邮 局 ， 最 后 送 
到 收 件 人 的 门口 。 


在 互联 网 中 ， 消 轧 使 用 的 路 径 会 有 所 不 同 ， 这 取决 于 它 所 使 用 的 
路 由 方法 。 有 两 类 方法 : 


. 在 自治 系统 (AS) 中 ， 使 用 基于 度量 的 (metric-based) 
路 由 。 利 用 基于 度量 的 路 由 ， 目 标 通常 是 找到 最 短 或 最 不 拥挤 的 路 
径 ， 到 达 目 的 地 。 

. 在 自治 系统 之 间 ， 路 由 则 是 基于 策略 的 〈policy- 
based) 。 例 如 ， 一 个 自治 系统 可 能 会 怀疑 另 一 个 系统 有 很 多 黑 
客 ， 并 和 希望 避免 将 数据 包 通 过 对 方 的 路 径路 由 。 


自治 系统 间 路 由 和 系统 内 路 由 非常 不 同 。 边 界 网 关 协 议 (简称 
BGP) 是 不 同 自治 系统 间 路 由 占 主导 地 位 的 协议 ， 它 将 互联 网 禁 在 一 
起 。 目 治 系统 内 有 两 种 主要 的 路 由 协议 : 


“路 由 信息 协议 ， 简 称 RIP， 其 中 每 个 路 由 器 收集 关于 自身 
和 其 他 路 由 器 之 间距 离 的 信息 ; 


“开放 最 短路 径 优先 ， 简 称 OSPF， 其 中 每 个 路 由 器 试图 建 
立 整 个 网 络 拓扑 结构 的 全 局 视图 。 


在 本 章 中 ， 我 们 将 介绍 RIP 痛 后 的 主要 思想 ， 并 跳 过 最 第 见 的 路 由 
类 型 OSPF 的 一 些 复 洒 细 广 。 
转发 


回 到 我 们 的 例子 ， 从 新 泽 西 寄 一 封 信 到 佛罗里达 。 当 新 泽 西 的 邮 
局 员工 收 到 信 后 ， 他 们 会 怎么 办 ? 他 们 会 看 信封 上 的 邮政 编码 ， 知 道 


它 要 到 佛罗里达 。 他 们 可 能 并 不 关心 具体 地 址 ， 比 如 哪个 城镇 或 城 
市 ， 只 知道 要 把 信 送 到 那个 州 的 某 个 地 区 邮局 。 所 以 他 们 会 把 信 放 到 
一 架 飞 往 佛 罗 里 达 的 飞机 上 。 然 后 ， 一 旦 信人 到达 那 里 ， 有 人 会 再 看 邮 
政 编 码 ， 知 道 要 把 它 送 到 迈阿密 。 所 以 他 们 会 把 它 放 到 开 往 那 儿 的 邮 
车 里 。 最 后 ， 一 旦 信人 到 达 迈 阿 密 该 邮政 编码 履 盖 的 范围 内 ， 当 地 邮政 
局 会 根据 上 面 的 地 址 把 它 送 给 收 件 人 。 


在 互联 网 中 ， 每 次 路 由 器 接收 数据 包 时 ， 就 会 发 生 转 发 
(forwarding) 行为 。 当 一 个 数据 包 到 达 后 ， 路 由 器 查看 写 在 数据 
包 里 的 目的 耳 地 址 ， 了 解 要 发 往 哪里 ， 并 将 其 发 送 到 路 径 上 的 下 一 
跳 。 然 后 下 一 个 路 由 絮 接 收 数据 包 ， 查 找 目 的 地 ， 继 续 转 发 数据 包 ， 
这 一 过 程 以 这 种 逐 跳 的 方式 继续 。 这 是 一 个 无 连接 的 过 程 ， 正 如 我 们 
在 第 11 划 讨论 模块 化 时 谈 到 的 那样 。 


根据 目标 的 距离 ， 路 人 径 上 前 面 的 路 由 右 可 能 只 关心 地 址 的 前 级 。 
换 句 话说 ， 它 们 首先 基于 目的 地 子 网 进行 转发 ， 这 类 似 于 邮政 系统 
先 问 目的 地 邮政 编码 转发 。 一 旦 数据 包 到 达 目 的 地 子 网 ， 后 面 的 路 由 
如 将 根据 主机 标识 符 转 发 到 特定 设备 上 。 


实际 情况 下 ， 转 发 如 何 发 生 ? 路 由 器 通过 链接 连接 到 网 络 中 的 其 
他 路 由 右 。 当 数据 包 到 达 输 入 链接 时 ， 路 由 名 将 它 转移 到 传 出 链接 。 
路 由 融 内 置 硬件 将 尽快 执行 此 功能 ， 迅 速 连接 起 管理 对 链接 访问 的 输 
入 和 输出 端口 。 


路 由 器 如 何 确定 ， 对 于 一 条 给 定 的 消息 哪个 是 正确 的 输出 链接 ? 
此 信息 保存 在 转发 表 (forwarding table) 中 ， 将 目标 IP 地 址 映射 
到 输出 链接 ， 如 图 12-5 所 示 。 利 用 转发 表 ， 路 由 器 可 以 查看 目的 IP 地 
址 ， 找 到 它 在 表 中 的 条 目 ， 并 选择 相应 的 传 出 链接 ， 就 像 使 用 电话 
短 ， 根 据 别 人 的 名 字 查 找 其 号 码 一 样 。 表 中 的 每 个 条 目 都 可 能 代表 很 


大 范围 的 地 址 ， 例 如 ， 图 12-5 中 ，10.1.2.1 和 10.1.2.10 都 可 以 到 达 链 接 
3 。 


图 12-5 


注 ， 当 数据 包 到 达 路 由 器 时 ， 路 由 器 将 在 其 转发 表 中 查找 目的 IP 地 址 ， 以 确定 将 数据 包 转 发 
到 哪个 输出 链接 

转发 表 需 要 建立 、 维 护 和 更 新 。 这 样 做 的 方式 取决 于 网 络 使 用 的 
路 由 方法 。 多 年 来 ， 许 多 不 同 的 方案 已 经 提出 。 接 下 来 ， 我 们 将 了 
解 ， 通 过 寻找 穿 过 网 络 的 最 短路 径 如 何 建立 这 些 表 。 


寻找 最 短路 径 


那么 ， 路 由 育 后 的 总 体 目标 是 什么 ? 以 最 佳 方式 从 互联 网 上 的 一 
点 〈 源 ) 到 达 另 一 点 《目的 地 ) 。 路 由 器 就 是 通过 网 络 传递 消息 的 中 
间 闻 点 。 


我 们 在 本 书 中 已 经 看 到 许多 不 同 的 图 表 ， 从 第 5 章 的 网 络 图 到 第 8 
划 和 第 10 章 的 社交 图 。 针 对 路 由 ， 我 们 现在 介绍 改 一 种 图 : 路 由 峰 


路 由 器 图 


看 看 图 12-6。 在 路 由 图 中 ， 源 的 工作 是 确定 转发 消息 到 哪个 近邻 
(在 这 里 是 A、B 或 C) 。 所 选择 的 节点 将 继续 转发 到 其 他 中 间 路 由 
器 ， 以 此 类 推 ， 直 到 消息 到 达 目 的 地 为 止 。 同 样 ， 转 发 是 以 一 次 一 跳 
(hop) 的 方式 进行 的 ， 其 中 一 跳 是 一 个 链接 。 


目的 地 


图 12-6 路 由 涉及 从 源 到 目的 地 的 流量 传输 


注 : 要 做 到 这 一 点 ， 每 个 节点 都 需要 知道 ， 对 于 转发 流量 到 某 个 目的 地 来 说 ， 哪 个 近邻 最 合 
适 


从 源 到 目的 地 可 能 有 多 种 方法 。 我 们 如 何 确 定 哪 条 路 径 是 最 好 
的 ? 通 遂 ， 我 们 想 要 选择 成 本 最 低 的 那 条 。 路 由 图 的 每 条 链接 表示 从 


一 个 路 由 器 到 男 一 个 的 实际 连接 ， 每 条 链接 都 有 与 其 相关 联 的 不 同 成 
本 。 通 币 ， 这 项 成 本 与 链接 连接 的 两 个 路 由 部 之 间 的 距离 有 关 。 例 
如 ， 同 一 个 房间 内 的 两 个 路 由 器 之 间 的 成 本 可 能 小 于 不 同 大 楼 里 两 个 
路 由 器 之 间 的 成 本 。 


我 们 应 该 用 什么 样 的 图 形 来 包含 成 本 ? 加 权 图 : 类似 于 在 第 5 章 
中 ， 我 们 利用 重要 性 得 分 对 超 链 接 进 行 加 权 ， 我 们 利用 成 本 对 路 由 器 
链接 加 权 。 在 图 12-6 中 ， 链 接 上 的 数字 表示 从 源 发 送 到 A 的 成 本 为 5， 
而 发 送 到 B 的 成 本 为 2。 此外， 路 由 图 中 的 链接 是 有 同 的 :， 如 宁 从 A 可 
以 转发 到 B， 这 并 不 意味 着 从 B 可 以 转发 到 A。 如 果 它 们 可 以 互相 转 
发 ， 在 每 个 方向 上 的 成 本 也 不 一 定 相同 。 


寻找 从 一 个 和 节点 到 另 一 个 节点 成 本 最 小 的 路 径 ， 这 个 任务 是 图 论 
中 一 个 显而易见 的 问题 ， 它 称 为 最 短路 径 问 题 (shortest-path 
problem) ， 因 为 人 们 经 常 将 链接 的 成 本 作为 其 距离 。 当 链接 的 所 有 
权重 都 相等 时 , “最 短路 径 ? 变 成 < 最 少 跳 数 ”。 


你 可 以 在 图 12-7 中 看 到 一 个 最 短路 径 问题 的 简单 例子 ， 它 包含 4 台 
路 由 器 和 4 条 链接 。 如 果 A 想 发 送 到 D， 它 可 以 向 B 或 C 转 发 。 沿 路 径 
(A，B，D) 的 成 本 是 2+4=6， 沿 路 径 (A，C，D) 的 成 本 是 3+5 
=8。 由 于 (A，B，D) 是 最 短路 径 ， 因 此 A 应 该 转发 到 B (然后 B 转 发 
到 D) 。 


> 


> 


图 12-7 
注 : 路 径 (A，B，D) 的 成 本 为 6， 路 径 的 (A，C，D) 成 本 为 8。 如 果 A 要 发 送 到 D， 它 应 该 


转发 到 B，B 再 转发 到 D 
贝尔 曼 -福特 算法 


如 何 发 现 目 治 系统 中 路 由 万 之 间 的 最 短路 径 ? 具体 方式 需要 能 有 
着 网 络 中 的 节点 和 链接 数量 扩展 ， 并 且 可 以 相对 迅速 地 根据 拓扑 结构 
中 的 变化 进行 调整 。 


和 目 20 世 纪 50 年 代 以 来 ， 最 短路 径 问 题 一 直 被 广泛 研究 。 一 些 车 名 
算法 被 开发 出 来 以 解决 该 问题 ， 如 贝尔 受 -福特 、 迪 杰 斯 特 拉 以 及 A 星 
搜索 ， 它 们 各 有 利弊 。 在 本 章 中 ， 我 们 将 关注 贝尔 曼 - 福 特 算 法 

(Bellman-Ford algorithm) ， 因 为 它 简 单 而 优雅 ， 并 阐述 了 路 由 
算法 背后 的 基本 原理 。 它 也 带 来 一 些 著 名 路 由 协议 的 实施 ， 如 最 初 的 
阿 帕 网 。 


贝尔 曼 - 福 特 算法 得 名 于 美国 数学 家 理 查 德 :贝尔 曼 和 李斯 特 - 福 
特 。 他 们 分 别 于 1958 年 和 1956 年 发 布 该 算法 。 贝 尔 曼 为 人 熟知 ， 更 主 
要 是 因为 他 在 20 世 纪 50 年 代 引 入 动态 规划 (dynamic 


programming) 的 方法 ， 这 种 方法 将 数学 、 计 算 机 科学 、 经 济 学 等 
学 科 的 复杂 问题 分 解 成 更 小 、 更 简单 的 子 问题 ， 使 其 更 容易 被 解决 
(符合 "分 而 治之 "的 总 体 原则 ) ， 因 此 具有 重要 意义 。 动 态 规划 中 将 
某 个 问题 与 其 子 问题 建立 联系 的 方程 ， 通 常 被 称 为 贝尔 曼 方程。 


忠 像 第 1 章 的 分 布 式 功率 控制 ， 贝 尔 曼 -福特 算法 古 一 个 不 断 重 复 
的 闪 代 过 程 ， 直 到 我 们 可 以 确定 它 已 经 完成 。 在 每 次 大 代 中 ， 它 都 会 
找到 一 条 从 源 到 目的 地 的 最 短路 径 ， 然 后 在 下 一 次 迭代 中 使 用 这 些 信 
轧 ， 看 它 是 否 能 找到 一 条 更 短 的 路 径 。 第 一 步 只 使 用 一 踊 ， 找 到 一 个 
最 短路 径 ， 第 二 步 最 多 使 用 两 跳 ， 第 三 步 最 多 三 跳 ， 以 此 类 礁 。 使 用 
更 多 跳 数 增加 了 更 多 可 能 性 ， 因 此 伴随 每 次 迷 代 ， 成 本 将 减少 (或 保 


持 不 变 ) 。 


让 我 们 以 图 12-8 中 的 路 由 絮 图 为 例 ， 来 说 明 贝 尔 曼 - 福 特 算法 。 
中 有 6 台 路 由 器 A 至 F， 链 接 成 本 如 图 所 示 。 路 由 器 A 至 E 的 目标 是 ， 找 
出 它们 到 达 目 的 地 F 的 最 低 成 本 路 径 。 


图 12-8 包含 六 台 路 由 器 的 示例 图 


注 : 链接 成 本 已 标 出 


第 一 步 


对 于 第 一 步 ， 我 们 只 需要 知道 ， 哪 些 节 点 有 一 跳 路 径 〈 即 一 个 链 
接 ) 到 FE， 哪些 没有 。A、B 和 C 不 能 通过 一 跳 到 那里 ， 因 为 它们 都 没 
有 直接 链接 到 F， 但 D 和 E 可 以 : 它们 的 直接 链接 成 本 分 别 为 8 和 和 10。 
此 ,一 跳 的 最 短路 径 和 相关 成 本 为 : 


D: 路 径 = (D，F) ， 成 本 =8 
E: 路 径 = (E，F) ， 成 本 = 10 


图 12-9 总 结 了 第 一 步 ， 其 中 链接 突出 显示 ， 并 标 出 到 F 的 成 本 。 


(10) 


图 12-9 单 跳 的 最 短路 径 和 成 本 
注 : D 和 E 都 可 以 通过 一 跳 到 达 F， 而 A、B 和 C 不 能 


第 二 步 


进行 到 第 二 步 ， 要 问 的 问题 是 ， 从 每 个 市 点 最 多 使 用 两 跳 ， 到 F 的 
最 短路 径 是 什么 ? 贝尔 曼 - 福 特 算法 使 用 第 一 步 的 信息 来 回答 。 毕 竞 ， 


如 采 某 个 下 点 有 一 个 可 转发 的 近邻 ， 可 以 通过 一 跳 到 达 F， 那 么 这 个 节 
点 必须 能 够 通过 该 邻居 ， 在 两 跳 后 到 达 F。 权 确定 这 个 路 径 的 总 成 本 ， 
我 们 可 以 把 该 节点 到 达 近 邻 的 成 本 ， 添 加 到 该 近邻 到 达 目 的 地 的 成 本 
站 二 


让 我 们 从 A 开 始 。 它 有 3 个 传 出 近邻 : B、C 和 D。B 和 C 都 不 能 在 

一 跳 后 到 达 F， 所 以 它们 现在 没有 帮助 。 与 此 相反 ，D 可 以 在 一 跳 后 到 

达 F， 成 本 为 8， 而 A 一 开始 转发 到 DD 的 成 本 为 6。 因 此 ，A 可 通过 路 径 

(A，D, F) ， 在 两 跳 后 到 达 F， 成 本 为 6 + 8 = 14。 这 是 A 到 达 F 最 短 
(也 是 唯一 ) 的 两 跳 路 径 。 


B 怎 么 样 ? 它 有 2 个 传 出 近邻 : C 和 E 。C 不 能 在 第 一 步 后 到 达 F， 
但 E 可 以 到 那里 ， 成 本 为 10。 由 于 B 转 发 到 E 的 成 本 为 4， 因 此 B 可 以 通 
过 路 径 (B，E，F) ， 在 两 跳 后 到 达 F， 成 本 为 4+10= 14。 


现在 到 C， 它 有 2 个 传 出 近邻 ，D 和 E。 它 们 都 能 够 在 第 一 步 后 到 达 


“ 由 于 D 到 目的 地 的 成 本 是 8， 因 此 通过 D 的 总 成 本 是 2+ 8 = 
10。 


“由 于 了 E 到 F 的 成 本 是 10， 因 此 总 成 本 是 3+ 10 = 13。 


由 于 10 比 13“ 更 短 ”， 因 此 C 将 选择 (C，D，F) 作为 其 到 达 F 的 两 
跳 路 径 。 


D 怎 么 样 ? 这 个 节点 有 2 个 传 出 的 近邻 : A 和 F。A 不 能 在 一 跳 后 到 
达 F， 所 以 直接 转发 到 F 仍 然 是 其 唯一 的 选择 。 实 际 上 ， 在 这 样 的 情况 
下 ， 路 由 器 可 以 直接 转发 到 目的 地 ， 它 会 发 送 到 其 他 地 方 吗 ? 也 许 
会 。 记 住 ， 最 短路 径 问 题 是 考虑 最 小 成 本 ， 而 不 是 最 小 跳 数 。 有 可 能 
出 现 有 中 间 环 市 但 总 成 本 较 低 的 情况 。 


现在 ， 让 我 们 考虑 E。D 和 F 是 它 的 两 个 传 出 近邻 : 


。 直 接 转发 到 F 的 成 本 为 10 。 
。 DD 到 达 F 的 成 本 为 8， 总 成 本 上 略 低 ， 为 1+8=9。 


所 以 ，E 将 选择 (E, D, F) 。 
总 结 ， 第 二 步 之 后 发 现 的 路 径 是 : 


A: 路 径 = (A F) ， 成 本 = 14 
B: 路 径 = (B， F) ， 成 本 = 14 
C: 路 径 = \C，D，F) ,成 本 = 10 
D: 路 径 = (D，F) ， 成 本 =8 


E: 路 径 = (E，D, F) ， 成 本 = 9 


如 图 12-10 所 示 。 与 图 12-9 相 比 ，A、B 和 C 现 在 都 可 以 到 达 目 的 
地 ， 并 且 E 选 择 的 路 径 已 经 改变 。 


图 12-10 两 跳 的 最 短路 径 和 成 本 


注 : 现在 所 有 市 点 都 可 以 到 达 F。B 仍 然 认为 通过 E 的 总 成 本 是 14， 因 为 它 还 没有 来 自 第 二 步 
的 更 新 成 本 

让 我 们 花 一 点 儿 时 间 分 析 贝 尔 曼 -福特 算法 为 发 现 最 短路 径 所 做 的 
工作 。 在 每 一 步 ， 路 由 器 看 着 每 个 传 出 近邻 ， 目 言 目 语 :“ 我 转发 到 你 
的 成 本 是 w， 而 你 到 达 目 的 地 的 成 本 是 x， 那 么 ， 如 果 我 通过 你 转发 ， 
再 经 过 一 跳 ， 到 达 目 的 地 的 成 本 将 是 w+x。 ?路 由 融会 选择 所 有 近邻 
之 间 最 低 的 总 成 本 。 你 可 以 在 图 12-11 中 看 到 这 个 理念 。 源 (S) 有 两 
个 传 出 近邻 ，A 和 B。A 可 以 在 比如 六 跳 后 到 达 目 的 地 (D) ,成 本 为 
XxX， 而 链接 (S$，A) 的 成 本 是 w。 因 此 ，S 可 以 通过 A， 在 七 跳 后 到 达 
目的 地 ， 成 本 为 w + x。B 的 情况 类 似 ， 成 本 将 是 y + z。 这 些 成 本 中 较 
低 的 一 个 ， 束 是 S 将 在 这 一 步 选择 的 。 


图 12-11 


注 : 在 贝尔 受 人 ， 源 检查 其 传 出 近邻 ， 看 哪 一 个 提供 到 达 目 的 地 的 最 低 总 
成 本 。 要 做 到 这 一 点 ， 它 必须 知 总 到 达 其 近邻 的 成 本 〈 这 里 是 w 和 y) 和 从 每 个 近邻 到 
目的 地 的 总 成 本 人 


第 三 步 


现在 进行 了 三 跳 ，A 是 什么 情况 ? 它 的 三 个 近邻 可 以 在 最 多 两 跳 
后 到 达 目 的 地 : 


。B 到 F 的 成 本 是 14， 所 以 通过 B 的 总 成 本 是 4+ 14= 18。 
。C 的 成 本 是 10， 所 以 总 成 本 是 2+ 10 = 12。 
“DD 到 目的 地 的 成 本 是 8， 所 以 总 成 本 是 6 + 8= 14。 


由 于 转发 到 C 带 来 最 低 成 本 12， 因 此 A 将 选择 (A, C, D, F) 。 


B 怎 么 样 ? B 既 可 以 转发 到 C， 总 成 本 为 5+ 10 =15， 也 可 以 转发 
到 E， 成 本 为 4+ 9 = 13。B 将 继续 选择 E，B 的 路 径 现 在 会 反映 E 在 第 二 
步 的 变化 。 


你 会 发 现 C、D 和 E 的 路 径 跟 上 次 相 比 不 会 改变 。 在 这 一 点 上 发 现 
的 路 径 是 : 
(A，C，D, F) ， 成 本 = 12 
路 径 = (B，E，D，F) ， 成 本 = 13 
(C，D, F) ， 成 本 = 10 
= (D，F) ， 成 本 = 8 
路 径 = (E，D，F) ， 成 本 =9 


结果 在 图 12-12 中 突出 显示 。 
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图 12-12 三 跳 的 最 短路 径 和 成 本 


实际 上 没有 必要 继续 四 、 五 或 更 多 跳 数 ， 因 为 在 这 个 例子 中 ， 该 
算法 已 经 确定 了 最 短路 径 。 总 的 来 说 ， 贝 尔 曼 -福特 算法 可 能 需要 进行 
图 中 节点 的 数目 ， 然 后 你 才 可 以 确定 它 已 经 完成 。 更 多 关于 这 方面 的 
言 息 ， 请 参考 本 书 网 站 Q12.3 部 分 。 


即便 如 此 ， 在 目 治 系统 路 由 的 真实 情景 中 ， 我 们 刚 开 始 通 常 不 知 
道 有 多 少 个 节点 。 相 反 ， 友 代 最 短路 径 算 法 必须 依赖 每 一 步 发 现 的 最 
短路 径 的 变化 ， 以 确定 什么 时 候 停 止 运行 是 安全 的 。 不 过 停止 只 能 是 
暂时 的 : 网络 结构 可 能 会 随时 间 而 改变 ， 影 响 链 接 成 本 、 节 点数， 或 
两 者 都 影响 ， 进 而 影响 在 任何 给 定点 的 最 短路 径 。 该 算法 需要 定期 运 
行 ， 以 保持 其 路 径 - 成 本 计算 不 断 更 新 。 


传递 消息 以 发 现 最 短路 径 


互联 网 上 的 路 由 通过 转发 实现 ， 一 次 发 生 一 跳 。 每 个 路 由 需 的 转 
发 表 只 包含 消息 下 一 步 应 该 发 送 到 哪里 的 信息 ， 如 图 12-5 所 示 。 在 我 
们 的 例子 (图 12-12) 中 ， 当 消息 到 达 路 由 器 A， 目 的 地 为 F 时 ，A 只 需 
要 知道 它 应 该 转发 到 C。 它 不 必 关 心 消息 在 此 之 后 将 选择 什么 路 径 。 
同样 ，B 只 知道 转发 到 E，C 转 发 到 D，D 转 发 到 F，E 转 发 到 D。 这 真是 
个 相当 惊人 的 分 布 式 路 由 特性 ! 


在 实践 中 ， 创 建 转发 表 需 要 一 个 额外 的 重要 步 怠 。 该 表 需 要 考虑 
每 个 路 由 右 只 有 网 络 的 本 地 视图 ， 这 意味 着 它 只 知道 其 近邻 的 存在 和 
路 径 - 成 本 信息 。 最 短路 径 需 要 以 分 布 式 补 发 现 ， 每 个 路 由 如 部 需要 根 
据 本 地 信息 构建 转发 表 。 


如 何 做 到 这 一 点 ? 通过 请 轧 传 递 。 路 由 万 必 须发 送 消 轧 给 近邻 ， 
表明 其 发 现 的 路 径 -成 本 信息 ， 并 基于 得 到 的 消 思 ， 不 断 更 新 目 己 的 


表 。 每 条 消 忌 都 简短 总 结 路 由 絮 可 以 到 达 的 所 有 目的 地 ， 以 及 到 达 每 
个 目的 地 的 路 径 的 总 成 本 。 


消 妃 传递 是 本 地 完成 的 ， 从 近邻 到 近邻 。 通 过 这 个 过 程 ， 路 由 需 
可 以 得 到 所 有 它们 需要 的 关于 端 到 端 最 短路 径 的 信息 ， 但 它 无 须知 道 
这 些 路 径 是 什么 。 对 于 图 12-12 中 我 们 的 示例 网 络 ， 消 恩 传 递 几 步 后 ， 
A 就 知道 它 到 F 的 最 短路 径 是 通过 C。 它 不 知道 C 会 继续 转发 到 D (C 也 
不 知道 D 会 转发 到 F) ， 同 时 出 于 在 网 上 转发 的 目的 ， 它 也 不 需要 知 
道 。 


贝尔 曼 - 福 特 算法 结合 消息 传递 的 一 个 应 用 ， 是 之 前 提 到 的 自治 系 
统 内 路 由 协议 RIP 的 实施 。 作 为 最 早 的 方法 之 一 ， 如 今 它 仍 然 在 使 用 ， 
而 路 由 器 之 间 的 一 跳 消 息 传 递 使 其 相当 容易 实现 。 我 们 提 到 的 为 一 个 
和 目 治 系统 内 协议 OSPF 时 ， 已 经 在 过 去 几 十 年 里 获得 很 大 的 知名 度 。 
RIP 只 保留 关于 近邻 的 信息 ， 而 利用 OSPF 时 ， 每 个 路 由 器 都 会 试图 构 
建 网 络 的 本 地 视图 ， 包 括 每 条 链接 的 状态 (如 成 本 ) 。 结 果 ，OSPF 是 
一 种 链 路 状态 (ink-state) 路 由 ， 而 RIP 是 距离 向 量 (distance- 
vector) 路 由 。OSPF 尤 其 适合 在 大 型 网 络 中 优先 使 用 ， 其 中 的 链接 状 
况 可 能 会 很 快 改变 。 


路 由 紫 传 递 消 恩 以 建立 转发 表 ， 古 网 络 分 布 式 算法 和 协调 的 男 一 
个 例子 ， 也 是 本 书 的 重要 主题 之 一 。 当 网 络 随 着 时 间 推 移 进行 扩展 和 
变化 时 ， 它 将 可 扩展 管理 考虑 在 内 。 第 一 部 分 的 功率 控制 和 载波 传 感 
征 我 们 已 经 看 到 的 其 他 分 布 式 程序 ， 而 我 们 在 第 13 章 讨论 拥塞 控制 
时 ， 还 将 看 到 男 一 种 。 记 住 ， 这 些 算 法 的 运行 ， 可 能 会 与 我 们 在 第 二 
和 第 三 部 分 讨论 的 排名 和 推荐 程序 的 集中 性 质 形 成 对 比 。 


第 五 部 分 


党 Z 二 
总 结 


互联 网 是 一 个 不 断 扩 大 的 网 络 之 网 络 ， 通 过 分 而 治之 的 原则 ， 
能 在 功能 和 地 理 上 保持 可 扩展 性 。 我 们 刚才 看 到 其 设计 背后 的 三 个 
基本 概念 : 分 组 交换 ， 对 资源 进 行 共 至 而 不 古 专 用 ;分 布 式 层次 结 
构 ， 在 地 理 上 将 控制 分 散 到 网 络 的 不 同 部 分 ， 模 块 化 ， 将 任务 分 为 


不 同 功 能 层 并 分 别管 理 。 我 们 还 详细 介绍 了 路 由 ， 这 征 在 互联 网 上 
从 一 地 到 男 一 地 传输 流量 的 重要 任务 。 它 也 以 可 扩展 的 方式 进行 ， 
通过 路 由 器 之 间 的 分 布 式 消息 传递 发 现 最 短路 人 径 ， 同 时 也 钙 网 络 中 
分 布 式 算法 和 协调 的 另 一 个 例子 。 


与 罗伯特 - 卡 恩 的 对 话 


罗伯特 : 卡 恩 被 公认 为 “互联 网 之 父 ?” 之 一 。 他 和 温 顿 . 瑟 夫 共同 发 明 
了 TCP/IP 。 


作者 : 鲍 过 (罗伯特 ) ， 要 是 没有 TCP/P， 你 认为 互联 网 能 有 今 
天 吗 ? 


鲍 勃 : 我 认为 TCP/IP 是 一 门 通用 语 。 这 是 一 组 协议 和 程序 ， 使 组 
成 互联 网 的 不 同 组 件 能 够 连接 在 一 起 。 那 么 ， 可 以 有 一 套 不 同 的 协议 
和 程序 ， 使 之 成 为 可 能 吗 ? 是 的 。 我 猜测 ， 为 了 取得 同样 的 建构 稳健 
性 ， 你 可 能 需要 某 些 相当 接近 我 们 以 前 在 TCPAP 中 做 的 东西 ， 但 它 可 
能 会 有 些 不 同 。 你 需要 这 样 的 东西 ， 让 各 部 分 组 合 到 一 起 ， 否 则 你 会 
遇 到 端 到 端的 互相 连通 性 问题 ， 其 中 所 有 接口 都 可 能 非常 不 同 。 所 以 
我 想 ， 如 果 没 有 温 顿 : 瑟 夫 和 我 发 明 的 协议 ， 或 与 之 十 分 类 似 的 东西 ， 
可 能 不 会 有 今天 的 互联 网 。 

作者 : 但 是 回头 看 ， 我 们 之 前 并 不 总 是 很 清楚 ， 那 就 是 我 们 的 前 
进 方 同 。 你 认为 ， 在 过 去 40 年 中 ， 是 什么 让 TCP/IP 以 可 互 操作 的 方 
式 ， 最 终 将 网 络 的 每 一 个 部 分 凝聚 在 一 起 ? 


鲍 勃 : 咽 ， 在 过 去 40 年 中 ， 这 个 世界 真 的 已 经 改变 了 很 多 ， 甚 至 
关于 互联 网 组 成 部 分 的 基本 概念 都 改变 了 一 些 ,但 是 ， 人 们 对 互联 互 
通 有 基本 需要 。 早 在 20 世 纪 70 年 代 初 期 ， 在 我 们 做 这 项 工作 时 ， 其 实 
没有 太 多 其 他 远 择 。 欧 洲 人 最 终 决 定 采取 类 似 行动 ， 他 们 集中 于 一 个 
和 我 们 几乎 相同 的 IP 方 法 ， 并 最 终 与 我 们 合并 ， 双 方 开 始 采用 相同 的 
基本 IP 战 略 ， 并 有 多 种 终端 到 终端 的 协议 。 我 想 ， 欧 洲 人 把 他 们 的 叫 


作 TP0、TP2 和 TP4， 最 终 它 们 没有 占据 一 席 之 地 ， 因 为 在 此 之 前 ， 太 
多 国家 已 经 采用 了 TCP。 


我 认为 这 更 多 是 建立 临 弄 质量 的 问题 ， 因 为 互联 网 的 发 展 是 渐进 
的 。 人 们 想 做 的 是 ， 将 他 们 可 以 互动 的 一 群 参 与 者 连接 起 来 ， 在 还 有 
零星 不 同 选择 的 时 候 ， 其 中 的 大 多 数 人 束 基 本 上 都 采用 了 TCP/IP。 甚 
至 当 国 际 标准 提出 后 ， 也 没有 人 愿意 化 时 间 和 精力 去 转换 ， 因 为 这 样 
做 没有 成 本 效益 。 


作者 : 在 1974 年 年 初 ，TCP/IP 其 实 是 一 个 协议 ， 之 后 才 被 分 成 两 
层 。 你 如 何 描述 这 个 从 一 个 协议 演变 为 两 层 的 过 程 ? 


鲍 勃 : 喝 ， 人 们 感受 到 的 问题 其 实 是 受 实时 通信 需要 的 驱动 。 第 
一 个 立即 可 用 的 产品 ， 是 我 在 美国 国防 部 高 级 研究 计划 车 时 开始 开发 
的 分 组 语音 程序 。 这 里 的 想法 是 ， 你 可 以 选取 模拟 语音 流 ， 将 其 数字 
化 ， 分 切 成 雄 片 ( 即 我 们 所 说 的 “ 包 衰 *”) ， 并 将 其 分 别 发 送 (或 分 
组 ， 或 通过 网 络 以 某 种 方式 将 其 量化 ， 使 其 成 为 更 大 的 聚合 ， 同 时 
能 够 在 数字 化 声 首 的 男 一 端 重建 一 个 连续 语 首 流 。 这 束 古 问题 ， 我 们 
证 明了 这 是 有 可 能 做 到 的 。 


现在 ， 在 原始 的 阿 由 网 协议 中 使 用 TCP 时 ， 每 次 有 消息 通过 ， 你 
要 先进 行 确认 ， 然 后 才能 发 送 下 一 条 消息 ， 所 以 这 可 能 会 产生 延迟 。 
这 样 的 网 络 效 应 是 ， 语 音 可 能 出 现 中 断 。 我 们 在 BBN (技术 公司 ) 的 
帮助 下 ， 通 过 引入 一 种 不 需要 确认 的 新 型 数据 包 ， 解 决 了 这 一 问题 。 
我 们 在 阿 由 网 中 称 之 为 三 型 数据 包 。 


但 是 当 我 们 来 到 事物 的 互联 网 方面 ， 端 到 端的 协议 是 TCP 协 议 ， 
它 将 下 捆绑 在 里 面 ， 所 以 它 是 复合 的 。 我 的 想法 是 ， 应 用 程序 会 和 
TCP 程 序 沟 通 ， 解 释 它 的 需要 。 所 以 ， 比 如 说 ， 如 有 果 对 方 是 语音 应 用 
程序 ， 这 个 应 用 程序 会 说 :“ 在 数据 包 到 达 时 发 送 给 我 ， 但 如 采 它 们 晚 
到 比如 20、40 或 60 坚 秒 的话 ， 束 不 用 费心 给 我 发 送 任何 数据 包 了 “。 我 


将 不 会 再 想 处 理 它们 ， 因 为 使 用 它们 已 经 太 晚 了 。” 我 的 想法 是 ， 
TCP/IP 程 序 可 以 决定 将 什么 传 给 程序 ， 这 取决 于 它 的 需求 。 事 实证 
明 ， 要 让 每 一 个 已 经 建立 的 应 用 程序 都 能 重新 编码 ， 能 够 解释 它 的 需 
求 是 什么 ， 然 后 使 TCP 程 序 可 以 接受 来 自 所 有 这 些 程序 的 输入 ， 这 真 
的 太 难 了 。 因 此 ， 一 个 更 稍 单 的 选择 是 ， 将 其 分 成 一 个 只 有 端 到 端的 
部 分 ， 以 及 一 个 不 可 靠 的 传输 部 分 ， 这 样 它 会 在 数据 包 到 达 后 吏 进 行 
传输 ， 主 端 到 端的 部 分 弄 清 人 楚 ， 如 何 把 它们 以 某 种 形式 重 者 组 合 在 一 
起 。 


这 束 古 导致 两 者 分 寞 的 原因 。 人 们 意识 到 需要 这 样 做 ， 我 想 很 多 
人 没有 认识 到 还 有 其 他 选择 。 但 现在 看 来 ， 我 认为 我 当时 提出 的 是 一 
个 更 好 的 长 期 战略 ， 但 它 不 是 一 个 非常 可 行 的 短期 策略 。 这 整 是 我 们 
选择 了 的 原因 ， 我 在 最 后 的 分 析 中 必须 同意 大 家 。 


作者 : 那 真是 一 段 非 常 有 趣 的 历史 。 对 于 路 由 部 分 ， 我 想 知道 你 
征 否 有 你 最 喜欢 的 类 比 ， 用 来 问 别 人 解释 网 络 上 的 路 由 是 如 何 工 作 
国志 


鲍 勃 : 我 更 倾向 于 解释 路 由 表 是 如 何 工作 的 。 也 就 是 说 ， 某 些 东 
会 从 一 条 线路 进入 一 个 市 点 。 这 个 市 点 可 能 是 一 个 分 组 交换 机 ， 或 
者 是 一 个 网 络 之 间 的 网 天 。 你 经 过 查找 ， 从 传 入 数据 包 中 找 出 它 的 传 
出 方向 ， 看 表 中 说 要 向 哪 条 输出 线路 输出 ， 然 后 把 它 放 在 那 条 线路 
上 。 表 基本 上 从 近邻 的 更 新 得 到 递增 。 基 本 上 ， 特 定 的 交换 机 或 网 关 
决定 谁 最 接近 最 终 目的 地 ， 然 后 会 试图 发 送 到 那里 。 你 可 能 有 更 全 面 
的 表 ， 全 局 表 代表 全 网 (如 有 果 你 知道 整个 拓扑 的 话 ) ， 然 后 你 就 可 以 
对 如 何 按 路 线 发 送 做 出 优化 决策 。 或 者 你 可 能 有 不 同 线路 上 的 流量 信 
思 ， 试 图 将 其 发 送 到 最 不 拥堵 的 路 径 ， 而 不 仅仅 是 最 近 的 连接 。 


如 果 我 要 笑 试 描述 路 由 如 何 工 作 ， 这 就 十 我 要 做 的 。 但 十 这 元 满 
变数 ， 并 且 根 据 情况 变化 ， 你 不 一 定 能 事先 选择 好 所 有 路 线 ， 并 坚持 


那个 “战略 ”"， 尽 管 你 可 以 这 样 做 。 


作者 : 如 果 你 可 以 回 到 比如 说 1974 年 ， 你 会 做 些 什 么 不 同 的 或 额 
外 的 事 ? 


鲍 勃 : 我 们 所 采取 的 大 部 分 措施 都 是 非常 明显 的 渐进 步骤 ， 除 了 
我 们 必须 发 明 的 整体 网 络 架 构 。 如 何 让 这 些 东 西 一 起 工作 ? 因此 ， 我 
们 必须 创造 下 地 址 的 概念 ， 我 们 必须 创造 网 关 或 路 由 天 的 概念 ， 以 及 
沟通 流量 的 通信 协议 等 ， 还 有 许多 中 间 的 东西 ， 如 网 关 - 网 关 协 议 ， 如 
何 显示 路 由 或 边界 网 关 协 议 ， 等 等 。 


我 可 以 告诉 你 我 希望 会 更 好 的 事情 。 我 希望 ， 我 们 早期 在 安全 方 
面 取得 更 大 进步 。 但 请 记 住 ， 我 们 确实 试图 做 到 这 一 点 。 我 们 并 不 是 
忽略 了 它 ， 虽 然 很 多 人 这 样 认为 。 但 与 此 相反 ， 为 了 真正 在 互联 网 上 
获得 有 意义 的 安全 ， 我 们 必须 让 该 领域 一 些 有 专长 的 人 与 我 们 合作 。 
他 们 甚至 不 确定 这 项 技术 将 会 是 有 用 的 ， 或 者 会 产生 某 些 结 采 。 当 时 
它 根 本 没有 商业 化 。 他 们 有 很 多 事情 要 操心 ， 实 在 没有 时 间或 精力 来 
关注 这 个 。 所 以 我 们 采取 了 一 些小 的 增 量 步 又， 你 可 以 在 互联 网 上 搜 
索 和 了 解 这 一 点 。 我 们 创造 了 最 初 的 私人 线路 接口 ， 但 它们 基本 上 是 
红色 和 黑色 的 处 理 器 ， 连 接着 中 间 的 加 密 设 备 。 事 实 上 我 们 对 它们 进 
行 了 测试 ， 并 且 有 办 法 规避 加 密 ， 以 进行 选择 性 寻 址 。 我 想 我 们 最 初 
是 用 一 个 站 点 进行 测试 ， 然 后 用 32 个 站 点 测试 。 所 以 有 增 量 的 改进 ， 
但 我 希望 我 们 当时 能 做 得 更 好 。 


第 二 件 我 们 刚 开 始 时 不 满意 、 体 系 结构 允许 的 事 ， 古 我 们 假设 还 
有 很 多 不 同 的 能 力 ， 并 假设 网 络 数量 会 很 小 。 那 时 的 网 络 都 很 大 ， 一 
般 都 像 阿 昌 网 、AT&T 网 络 或 防御 网 ， 或 者 是 某 种 广域网 那样 。 我 们 
假设 会 有 少数 几 个 ， 也 许 全 世界 有 4、8、16 个 ， 但 很 快 就 有 数 以 千 计 
以 太 网 这 样 的 网 络 出 现 。 这 一 切 的 网 络 效 应 是 ， 我 们 最 初 的 寻 址 工作 
假设 有 32 位 的 地 址 空间 ， 我 们 给 网 络 分 配 8 位 ， 给 网 络 上 的 终端 机 器 分 


配 24 位 ， 但 这 很 快 就 被 最 新 的 发 展 追 赶 上 。 因 此 ， 我 们 最 终 在 实时 处 
理 中 ， 不 得 不 重新 开发 应 对 方法 。 我 想 ， 如 果 我 们 之 前 了 解 它 会 有 多 

影响 ， 就 应 该 早点 儿 着 手 ， 开 发 比如 128 位 或 256 位 的 地 址 ， 也 就 不 
必 经 历 所 谓 IPv4 向 IPv6 过 渡 的 痛苦 。 


多 年 来 ， 我 一 直 在 研究 如 何 围 统管 理 信息 的 概念 重 塑 互联 网 ， 而 
不 仅仅 古 移 动 数 据 字 广 。 我 一 直 在 人 研究 所 谓 的 数字 对 象 框架 ， 这 在 全 
球 都 得 到 了 推动 。 但 美国 并 没有 大 力 发 展 它 ， 因 为 人 们 的 关注 点 部 在 
网 络 上 ， 而 在 全 球 范围 内 ， 人 们 对 这 一 领域 的 兴趣 非常 大 。 如 采 我 早 
距 想 到 它 ， 那 在 40 年 前 我 就 会 这 样 做 的 。 


作者 : 你 能 描述 一 下 数字 对 象 框架 吗 ? 


鲍 勃 : 我 们 在 这 个 框架 中 所 做 的 ， 是 从 这 一 概念 入 手 : 我 们 处 理 
的 每 个 东西 都 是 数字 对 象 ， 而 数字 对 象 要 么 是 一 个 比特 序列 ， 要 人 么 是 
一 组 比特 序列 ， 并 且 有 唯一 的 持久 标识 符 。 如 采 你 在 谈论 信息 ， 这 些 
信息 可 以 征 数 字 对 象 的 形式 ， 但 是 你 也 可 以 拥有 代表 个 人 的 数字 对 
象 。 事实 上 ， 如 采 你 解析 了 这 个 对 象 ， 你 不 会 得 到 一 个 人 ， 但 会 得 到 
有 关 这 个 人 的 信息 ， 如 他 们 的 公共 密 钥 ,或 某 天 可 以 在 哪里 联系 他 
们 ， 或 任何 其 他 他 们 想 让 你 知道 的 事 ， 甚 至 古 他 们 的 电子 邮件 地 址 
等 。 因 此 ， 我 们 假设 ， 在 网 络 环境 中 ， 你 关心 的 每 一 个 资源 都 有 它 目 
己 的 特性 。 因 此 ， 如 有 果 你 试图 与 某 个 东西 进行 连接 ， 你 可 以 通过 使 用 
公共 密 钥 来 进行 挑战 (应答) 交互 ， 发 现 你 所 连接 的 对 象 。 因 此 ， 数 
字 对 象 有 唯一 的 持久 标识 符 ， 我 们 正好 称 它们 为 句柄 ， 但 它们 确实 是 
你 所 谈论 的 清晰 标识 符 。 


例如 ， 在 今天 的 世界 上 ， 比 方 说 ， 如 果 你 使 用 一 个 URL 访 问 某 台 
机 妖 上 的 文件 ， 同 时 想 将 其 保存 下 来 ， 也 许 那 是 政府 信息 或 者 企业 信 
思 。100 年 后 ， 你 希望 能 回来 获得 这 些 信息 ， 但 很 可 能 这 个 URL 已 经 没 
用 了 。 这 台 机 器 已 经 消失 ， 公 司 名 称 可 能 已 经 更 改 ， 或 者 信息 可 能 不 


在 那个 文件 中 。 但 如 果 你 给 这 条 信息 一 个 唯一 的 标识 符 ， 那 么 无 论文 
件 在 哪里 ， 只 要 有 人 得 到 它 ， 你 束 能 将 这 个 标识 符 解 析 为 信息 ， 我 称 
之 为 状态 信息 。 


我 肯定 你 读 过 IEEE 汇 刊 或 ACM 期 刊 ， 或 任何 传统 科学 期 刊 。 在 今 
天 的 科学 文献 中 ， 大 家 都 在 使 用 这 个 系统 ， 它 们 全 都 使 用 这 个 框架 。 
我 们 称 之 为 句柄 系统 ， 它 有 能 力 存储 被 识别 对 象 的 状态 信息 ， 这 样 你 
忠 可 以 重 狐 获得 它 。 如 果 它 是 可 用 的 ， 它 可 以 告诉 你 应 该 去 哪里 访 
问 。 你 可 以 移动 对 象 。 它 可 以 在 印刷 的 引用 资料 中 ， 也 可 以 存在 于 电 
子 存储 系统 中 ， 但 即使 你 移动 信息 或 改变 的 层 技 术 基 础 ， 也 必须 回去 
改变 标识 符 。 如 果 有 人 这 样 做 ， 标 识 符 就 会 把 你 带 到 那里 。 当 然 ， 你 
必须 得 到 允许 才能 去 访问 它 。 可 能 需要 付费 ， 可 能 会 有 防火 墙 阻止 你 
获取 某 些 信息 ， 但 原则 上 ， 框 染 是 允许 这 样 做 的 。 


这 个 框架 有 三 个 组 成 部 分 。 一 是 我 谈 到 的 解析 系统 ， 我 们 称 其 为 
句柄 系统 。 它 获取 一 个 标识 待 ， 并 将 被 识别 事物 的 状态 信息 返回 给 
你 。 第 二 ， 存 储 库 技 术 可 以 让 你 存储 数字 对 象 ， 并 完全 基于 其 标识 符 
访问 它们 ， 这 样 它们 可 以 被 存储 于 后 台 的 任何 地 方 ， 如 U 盘 、RAID 阵 
列 或 只 是 云 服务 中 〈 任 何 你 想 用 来 存储 的 方法 都 可 以 ) 。 而 且 这 一 切 
都 是 用 户 看 不 见 的 ， 因 为 它 藏 在 存储 库 背 后 。 最 后 ， 我 们 称 为 DO 存储 
库 和 DO 注册 表 的 注册 表 一 般 存 储 对 象 的 元 数据 ， 它 人 允许 你 浏览 或 搜索 
注册 表 ， 并 在 完成 后 向 你 返回 标识 人 符 。 最 近 ， 我 们 已 经 采用 这 些 组 件 
中 的 两 个 一 一 注册 表 和 存储 库 ， 并 将 其 合并 成 一 个 具有 存储 库 或 注册 
表 功 能 的 转 键 系统 ， 因 为 存储 库 需 要 注册 表 ， 才 能 知道 存储 库 中 有 什 
么 ， 而 注册 表 需 要 存储 库 来 保存 元 数据 记录 。 我 们 现在 已 经 做 出 来 
了 ， 你 可 以 在 网 上 通过 URL cordra.org 找 到 一 个 版 本 。 


人 简 而 言 之 就 十 这 样 。 对 于 框架 而 言 有 趣 的 一 点 是 ， 任 何 采 用 它 的 
人 ， 无 论 他 们 在 后 台 使 用 什么 技术 (就 像 如 果 你 使 用 人 P 地 址 ， 你 可 以 
在 后 台 使 用 任何 一 台电 脑 ) ， 都 能 得 到 可 互 操作 的 系统 ， 并 解决 所 有 


和 事物 大 小 相关 的 问题 。 你 可 以 在 循环 中 使 用 存储 库 ， 访 问 这 些 数字 
对 象 ， 并 将 其 存储 供 以 后 演示 。 它 这 有 内 置 的 安全 性 ， 因 为 解析 系统 
可 以 存储 公开 密 匙 。 因 此 ， 它 允许 你 调用 公 钥 基础 设施 ( PKI ) 的 所 有 
功能 ， 而 且 无 须 承 担任 何 额外 成 本 。 我 认为 ， 这 是 一 个 非常 好 的 管理 
信息 前 进 的 模型 ， 因 为 它 不 仅 将 信息 你 持 在 一 起 ， 同 时 它 也 是 目 己 的 
内 部 编目 系统 。 


作者 : 围绕 数字 对 象 运行 的 互联 网 和 围绕 数据 字 节 运行 的 互联 网 
看 起 来 有 什么 区 别 ? 


鲍 勃 : 我 认为 这 不 一 定 会 影响 到 今天 互联 网 的 底层 部 分 ， 因 为 你 
可 以 把 存储 库 连 接 到 今天 的 互联 网 中 。 你 可 以 使 用 注册 表 、 组 合 版 
本 ， 或 者 句柄 系统 。 它 们 只 是 利用 今天 互联 网 中 的 一 切 ， 如 有 末 你 有 东 
西 可 以 做 到 这 一 点 ， 它 可 能 也 可 以 利用 这 一 点 。 所 以 这 不 是 单 癌 的 ， 
它们 可 以 互相 利用 。 如 采 它 是 数字 对 象 ， 通 过 以 太 网 ， 它 将 被 以 一 种 
方式 处 理 。 如 有 果 通 过 令 牌 环 网 ， 它 可 能 会 受到 略 有 不 同 的 处 理 。 确 层 
通信 技术 将 做 到 这 点 。 它 可 以 以 各 种 方式 把 它 分 解 成 比特 和 字 节 。 但 
最 终 ， 只 要 所 有 的 比特 到 达 另 一 端 ， 同 时 你 可 以 验证 它们 被 正确 接 
收 ， 那 么 你 殊 真 的 不 应 该 天 心 下 面 发 生 了 什么 ， 只 要 它 的 效率 和 成 本 
效益 高 束 行 。 


作者 : 你 说 ， 如 果 回 到 1974 年 ， 你 可 能 会 把 数字 对 象 框架 更 多 地 
放 入 TCP/IP 中 。 你 具体 会 采取 什么 不 同 的 行动 ? 


鲍 勃 : 不， 我 不 会 把 它 放 入 TCP/IP 中 。 我 会 从 那个 构想 开始 ， 并 
看 它 如 何 适 用 于 不 同 的 网 络 环境 ， 因 为 如 采 你 面 对 的 是 一 个 可 互 操作 
的 系统 ， 并 且 它 知道 如 何 通 过 协议 接口 沟通 ， 它 将 完全 可 互 操作 地 处 
理 任 何其 他 系统 。 问 题 是 ， 你 如 何 将 比特 传输 到 那里 ? TCP/IP 补 开发 
来 处 理 各 种 应 用 程序 中 分 散 的 网 络 系统 ， 你 可 以 直接 使 用 它 。 或 者 如 
果 你 愿意 ， 可 以 想象 重 狐 考虑 互联 网 的 基础 结构 。 但 请 记 住 ， 互 联网 


分 布 于 世界 各 地 ， 你 不 大 可 能 改变 一 切 ， 至 少 不 会 立即 改变 ， 也 许 永 
远 都 不 能 改变 一 切 。 所 以 你 需要 处 理 所 有 的 变幻 莫 测 ， 包 括 今天 互联 
网 中 存在 的 情况 ， 并 且 保 持 前 进 。 


作者 : 今天 的 互联 网 和 你 想象 的 有 什么 不 同 ? 


饥 勒 : 大 不 一 样 。 当 我 们 刚 起 步 时 ， 我 认为 这 是 一 个 研究 实验 。 
我 们 想 知 道 ， 如 何 能 使 不 同 网 络 一 起 工作 ， 让 这 些 网 络 上 的 电脑 能 够 
互相 交流 ， 所 以 刚 开 始 时 我 们 只 假设 有 少量 的 网 络 和 少量 的 计算 机 。 
请 记 住 ， 当 我 们 刚 起 步 时 ， 并 没有 工作 站 或 个 人 电脑 等 。 你 唯一 能 使 
用 的 是 大 型 分 时 系统 。 这 些 都 是 价值 数 百 万 美元 的 机 器 ， 世 界 上 很 少 
有 人 拥有 它 ， 我 们 起 步 时 也 许 只 有 100 家 机 构 拥 有 。 这 就 是 我 们 所 看 到 
的 情况 ， 当 时 ， 它 在 一 点 点 成 长 。 然 后 周围 突然 出 现 了 工作 站 ， 到 20 
世纪 80 年 代 初 ， 个 人 电脑 开始 出 现 。 然 后 ， 比 起 拥有 100 台 机 器 ， 我 们 
想 也 许 会 有 数 千 台 ， 上 万 台 ， 甚 至 数 十 万 台 ， 如 今 有 多 少 ? 大 概 有 30 
亿 台 设备 在 网 上 ， 而 物 联网 中 可 能 有 200 亿 到 1 000 亿 人 台 。 


作者 : 也 就 是 说 ， 连 接 设备 的 数量 有 了 很 大 的 增长 。 


鲍 勃 : 我 们 已 经 有 了 比 以 前 多 得 多 的 连接 设备 。 有 时候 ， 即 使 在 
同一 台 机 器 上 ， 也 会 有 很 多 虚拟 机 和 应 用 程序 在 同一 设备 上 运行 。 我 
想 还 可 以 说 ， 我 们 见证 了 带宽 的 扩展 。 最 初 网 速 只 有 50 比 特 / 秒 ， 我 认 
为 ， 现 在 设想 网 速 平 均 达 到 10 到 100 千 兆 位 / 秒 ， 不 是 没有 道理 的 ， 所 
以 内 存 增长 了 约 100 万 倍 。 在 计算 能 力 方面 ， 以 前 的 机 器 可 能 会 被 今天 
最 便宜 的 数字 手表 打败 ， 所 以 计算 速度 至 少 提高 了 100 万 倍 ， 同 时 它 没 
有 任何 放 慢 的 迹象 。 因 此 ， 也 许 10 年 后 将 增长 10 亿 倍 。 在 科技 史 中 ， 
没有 其 他 技术 的 贡献 可 以 超过 这 一 范围 。 


作者 : 确实 如 此 。 在 这 个 令 人 印象 非常 深刻 的 过 程 中 ， 你 认为 数 
学 在 这 些 系统 的 分 析 和 设计 中 发 挥 了 什么 作用 ? 


鲍 达 : 这 是 一 个 很 有 趣 的 问题 。 在 职业 生涯 初期 ， 我 曾 打算 从 事 
学 术 工 作 。 我 认为 我 基本 是 沿 着 传统 数学 教育 路 线 接受 训练 的 。 我 对 
数学 中 的 问题 很 感 兴趣 ， 而 且 很 擅长 处 理 其 中 的 一 些 问题 。 当 然 ， 有 
比 我 聪明 得 多 的 人 在 处 理 真 正 复 灯 的 理论 数学 问题 。 但 我 发 现 ， 我 处 
理 的 应 用 数学 问题 真 的 很 有 趣 ， 我 喜欢 这 种 工作 。 此 外 ， 这 些 年 来 ， 
已经 出 现 了 很 多 与 网 络 有 关 的 有 趣 结 采 。 里 特 尔 的 定理 就 是 一 个 例 
子 。 雷 央 : 克 莱恩 洛克 对 独立 性 假设 进行 研究 ， 他 通过 假设 某 些 无 法 证 
明 是 独立 的 情况 ， 成 功 证 明了 网 络 性 能 的 一 些 方面 。 但 仅仅 假设 它们 
征 独 立 的 ， 他 融 可 以 得 到 封闭 形式 的 解决 方案 。 


我 、 雷 恩 : 区 沫 恩 洛 元 和 和 霍华德 弗 兰 元 写 了 一 篇 文章 。 霍 华 德 为 阿 
则 网 做 了 所 有 的 早期 布局 设计 。 我 们 三 个 人 写 的 一 篇 论文 叫 作 * 计 算 机 
通信 理论 和 设计 的 经 验 教 训 ”。 我 们 当时 提出 的 一 个 问题 是 :我 们 如 何 
知道 应 该 设计 和 建造 多 大 的 网 络 ? 我 们 都 思考 了 这 个 问题 ， 并 且 每 个 
人 都 有 目 己 的 想法 ， 不 过 答案 都 在 60 或 64 世 点 左右 。 我 们 知道 彼此 的 
答案 后 说 ， 这 真是 奇妙 啊 。 我 们 对 此 都 有 相同 的 看 法 ， 为 什么 呢 ? 雷 
恩惠 移 插 话 ， 他 说 ， 当 解 开 吞吐 量 和 网 络 的 延迟 方程 时 ， 该 方程 的 分 
母 趋 于 零 ， 克 点 的 数量 大 约 是 60。 因 此 ， 我 们 最 多 可 以 达到 60， 因 为 
这 个 方程 趋 于 无 穷 大 。 上 霍华德 说 ， 这 真 的 很 有 趣 ， 因 为 我 没有 关注 数 
学 ， 但 我 做 了 大 量 的 模拟 工作 ， 当 达到 60 个 节点 时 ， 我 在 模拟 中 用 完 
了 内 存 空间 ， 并 且 无 法 再 继续 计算 。 我 说 ， 这 真 的 很 有 趣 ， 因 为 当时 
征 1972 年 ， 阿 由 网 刚刚 建立 。 我 说 ， 我 们 今天 在 50 千 位 的 线路 上 运 
行 ， 如 果 你 看 一 看 路 由 表 ， 如 果 路 由 表 远 远大 于 60 或 64 个 点 ， 网 络 
带宽 中 的 每 个 比特 都 会 在 通过 路 由 表 时 被 消耗 挥 ， 我 们 不 知道 该 怎么 
办 。 当 然 ， 现 在 如 果 我 们 使 用 百 万 位 的 线路 ， 那 么 这 个 制约 就 不 会 存 
在 ， 如 果 有 更 多 内 存 ， 和 霍华德 的 模拟 束 不 会 失败 。 雷 恩 的 方程 可 能 需 
要 进行 不 同 的 调整 。 但 基本 绪论 是 ， 这 是 有 三 种 不 同 的 思考 角度 ， 但 
事实 证 明 ， 具 体 实施 没有 在 很 大 程度 上 依赖 于 模拟 ， 而 模拟 没有 在 很 
大 程度 上 取决 于 数学 ， 所 以 它们 只 是 解决 问题 的 三 种 不 同方 式 。 


现在 ， 我 不 能 为 所 有 可 能 的 应 用 都 下 结论 。 我 认为 ， 示 来 可 能 
越 来 越 多 的 案例 ， 人 民 好 的 数学 模型 来 知道 这 些 构想 是 否 会 
有 效 ， 但 我 还 不 知道 它们 会 是 什么 。 


作者 : 鳃 芝 ， 谢 谢 你 与 我 们 分 享 你 的 想法 。 


第 六 部 分 
湛 到 端 


对 于 电脑 来 说 ， 互 联网 有 时 看 起 来 像 一 个 墨盒 子 。 它 传送 和 接 
收 你 的 消 奶 ， 却 不 知道 你 和 正在 交流 的 其 他 人 之 间 的 网 络 内 部 到 奈 
ee 


端 到 问 欣 制定 我 们 的 第 六 条 ， 也 是 最 后 一 条 网 络 原理 。 在 第 13 
章 ， 我 们 将 看 到 互联 网 设备 如 何 利用 来 目 接收 者 的 反馈 ， 来 推 朵 和 
管理 网 络 中 的 拥塞 。 这 要 求 设备 之 间 进 行 分 布 式 协调 ， 当 它们 正确 


接收 数据 包 时 ， 通 过 网 络 来 回 发 送 彼此 的 确认 消 轧 。 

拥塞 控制 将 结束 我 们 对 互联 网 内 部 运作 情况 长 达 三 章 的 讨论 。 
在 第 14 章 中 ， 我 们 将 回 到 社会 网 络 ， 了 解 人 们 如 何 仍然 可 以 在 看 似 
相对 的 网 络 两 端 被 连接 。 正 如 我 们 将 看 到 的 ， 它 要 求人 们 仅 使 用 本 
地 信息 发 现 短路 径 ， 使 它 即使 在 如 此 庞大 并 不 断 扩 张 的 网 络 中 ， 也 
能 成 为 一 个 小 世界 。 


第 13 章 
控制 拥堵 


在 第 12 章 讨论 分 组 路 由 时 ， 我 们 从 来 没有 说 过 一 次 可 以 传输 多 少 
数据 包 。 由 于 组 成 互联 网 链接 的 硬件 只 能 以 这 个 速度 发 送 比特 ， 因 此 
需要 有 一 种 方法 来 控制 流量 。 传 输 层 的 任务 是 ， 确 保 对 互联 网 的 需求 
不 超过 链接 的 供应 。 当 超过 时 ， 必 须 运 行 终端 主机 的 拥塞 控制 
(congestion control) ， 使 需求 回落 到 可 接受 的 水 平 。 


如 何 控制 拥 增 ? 


请 看 图 13-1， 它 显示 了 一 条 链接 上 的 拥塞 示例 。 爱 丽 丝 目前 以 30 
Mbps 的 速度 发 送 数据 ， 而 鲍 勃 以 20 Mbps 的 速度 发 送 ( 记 住 ，Mbps 是 
衡量 速度 的 标准 ， 即 每 秒 百 万 比特 ) 。 链 接 容量 是 40 Mbps， 表 示 它 每 
秒 可 以 传输 达 4 000 万 比特 ， 而 用 户 共 需 要 50 Mbps， 超 出 25%。 需求 
超过 供给 。 


一 二 一 一 二 一 全 一 二 一 全 链接 
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图 13-1 
注 : 两 个 用 户 对 链接 的 需求 总 和 〈30 + 20 = 50 Mbps) 高 于 链接 的 容量 40 Mbps， 造 成 拥堵 


那么 ， 会 发 生 什 么 呢 ? 数据 包 开始 积聚 在 链接 前 端的 缓冲 区 中 。 
它们 被 存储 在 那里 ， 形 成 队列 ， 等 待 被 传送 的 机 会 。 那 就 像 古 说 困 在 
交通 墙 塞 中 (图 13-2) ， 路 上 的 车 流量 导致 大 家 都 要 慢 慢 向 前 挪动 ， 
直到 它们 排 到 队伍 的 前 面 ， 才 可 以 继续 前 进 。 人 困 在 交通 堵塞 中 的 时 
间 类 似 于 数据 包 在 传输 前 排队 等 待 的 时 间 (不 过 两 者 处 于 极为 不 同 的 


时 间 维 度 ， 一 个 是 分 钟 ， 一 个 是 毫秒 ) 。 


图 13-2 互联 网 中 的 拥塞 类 似 于 我 们 遇 到 的 交通 堵塞 


更 粳 的 征 ， 随 痢 越 来 越 多 的 汽车 进入 交通 墙 塞 ， 对 于 稍 后 进入 的 
人 来 说 ， 线 路 会 变 得 更 长 。 同 样 ， 随 着 更 多 数据 包 堆 积 到 缓冲 区 ， 队 
列 会 变 得 更 长 ， 拥 塞 也 会 越 来 越 广 重 。 节 终 ， 缓 冲 区 会 次 出， 导致 数 
据 包 被 圣 弃 ， 就 像 水 从 已 经 法 满 的 桶 顶部 洲 出 一 样 。 具 体 哪 些 数据 包 
会 被 丢 弃 ， 取 决 于 队列 管理 协议 的 详细 信息 。 


互联 网 (特别 是 传输 层 ) 如 何 控制 这 一 点 ? 


20 世 纪 80 年 代 末 ， 计 算 机 科学 家 范 - 雅 各 布 森 提 出 第 一 代 拥 塞 控 制 
机 制 。 它 被 称 为 TCP 太 浩 (TCP Tahoe) ， 得 名 于 内 华 达 山脉 的 太 
浩 湖 (我 们 将 看 到 ， 许 多 拥塞 控制 算法 都 是 以 这 种 方式 命名 ) 。 它 于 
1988 年 首先 成 为 TCP 协 议 的 一 部 分 ， 并 被 认为 在 20 世 纪 80 年 代 末 90 年 
代 初 挽救 了 互联 网 崩溃 。 此 后 ，TCP 太 浩 被 广泛 研究 ， 并 经 过 多 次 改 
进 ， 但 在 它 的 早期 版 本 中 ， 互 联网 拥塞 控制 的 许多 基本 思路 就 已 经 出 
现 。 


又 是 反馈 


还 记得 我 们 在 第 2 章 谈 到 的 无 线 设备 发 送 确认 吗 ? 利用 TCP， 互 联 
网 的 终端 主机 (end hosts) 遵循 类 似 的 系统 ， 对 于 发 射 器 发 在 互联 
网 上 的 每 个 数据 包 ， 当 (以 及 如 果 ) 其 成 功 到 达 接 收 器 ， 对 方 将 回复 
确认 (ACK) 包 给 发 送 器 。 你 可 以 在 图 13-3 中 看 到 这 个 理念 ， 当 终端 
主机 收 到 确认 ， 它 便 知道 数据 包 发 送 成 功 。 否 则 ， 一 段 时间 后 ， 它 会 
壬 试 重新 发 送 数 据 包 。 
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图 13-3 
注 : 当 发 送 端 发 送 数据 包 后 ， 接 收 端 发 送 确 认 (ACK) ， 表 示 正 确 接收 。 确 认 是 负 反 馈 信 


号 ， 它 向 发 送 端 提供 衡量 网 络 拥塞 的 标准 


尽管 确认 提高 了 可 靠 性 ， 但 可 以 想象 ， 其 本 号 实际 上 会 使 拥堵 更 
加 严重 。 在 拥挤 的 网 络 中 ， 数 据 包 可 能 会 延迟 很 长 时 间或 被 完全 丢 
弃 ， 导 致 接收 亏 不 发 送 确认 。 没 有 确认 ， 发 送 端 将 重 发 数据 包 ， 在 已 
经 拥挤 不 堪 的 系统 缓冲 区 中 增加 更 多 数据 。 当 这 些 重 发 数据 同样 得 不 
到 确认 时 ， 写 们 将 芝 试 再 次 发 送 ， 以 此 类 推 ， 导 致 恶性 循环 。 


但 确认 系统 还 提供 了 一 个 管理 拥堵 的 巧妙 方式 。 发 射 句 可 使 用 确 
认 《或 确认 缺失 ) 来 推断 网 络 的 条 件 ， 因 为 这 些 确认 表明 数据 包 是 否 
以 及 多 久 会 到 达 目 的 地 。 如 果 数 据 包 成 功 到 达 ， 那 么 它们 可 以 继续 发 
送 ， 也 许 会 以 更 快 的 速度 发 送 ， 因 为 快速 确认 可 能 表明 路 径 没有 被 完 
全 占用 。 但 这 些 确认 被 卡 住 或 丢失 表示 网 络 出 现 拥塞 ， 所 以 一 旦 发 生 
这 种 情况 ， 发 射 秦 应 减少 发 送 速率 ， 以 缓解 拥堵 。 


这 样 ， 确 认可 以 作为 给 发 送 端的 反馈 信号 ， 用 来 表示 传输 速率 应 
何 时 降低 或 提高 。 我 们 已 经 看 到 ， 负 反馈 作为 网 络 的 一 个 重要 主题 ， 
在 本 书 中 多 次 出 现 ， 特 别 是 在 第 一 部 分 ， 它 帮助 手机 控制 其 功率 水 平 

(第 1 章 ) ， 帮 助 Wi-Fi 设 备 降低 其 传输 速率 〈 第 2 章 ) ， 以 及 帮助 互联 
网 服务 提供 商 规范 数据 需求 〈 第 3 章 ) 。 我 们 在 第 9 章 中 讨论 如 何 触发 
信息 瀑布 时 ， 提 到 与 之 相对 的 正 反 馈 。 在 互联 网 上 ， 负 反馈 对 于 防止 
拥塞 朋 溃 也 是 非常 重要 的 。 负 反馈 往往 是 “正面 ?的 事物 ! 


那么 ， 如 果 在 拥塞 控制 机 制 中 ， 让 互联 网 的 路 由 器 而 非 终端 主机 
负责 决定 发 射 器 应 该 使 用 什么 速率 ， 情 况 会 怎样 2 这 听 起 来 似乎 很 直 
观 : 毕竟 ， 真 正 处 于 网 络 中 的 是 路 由 器 ， 所 以 它们 很 可 能 会 很 好 地 推 
呆 链 路 拥塞 。 但 是 ， 如 果 路 由 器 管理 拥塞 ， 它 们 将 需要 监视 端 到 端的 
连接 。 这 也 违背 了 我 们 在 第 11 章 提 到 过 的 互联 网 的 端 到 端 设 计 
(end-to-end design) 理念 : 把 适合 终端 主机 的 工作 留 给 它们 。 通 
过 TCP， 拥 塞 控 制 由 终端 主机 人 负责 。 


滑动 窗口 


随 着 反馈 机 制 到 位 ， 下 一 步 是 决定 终端 主机 将 如 何 使 用 它 来 调 世 
其 传输 。 也 许 我 们 可 以 让 终端 主机 发 送 一 个 数据 包 ， 然 后 等 竺 该 数据 
包 的 确认 ， 之 后 再 发 送 另 一 个 ?“ 一 个 接 一 个 ”的 方案 会 很 慢 而 且 很 低 
效 ， 因 为 这 表示 每 台 终端 主机 每 次 只 能 在 网 络 上 发 送 一 个 数据 包 。 


TCP 通 过 提供 大 于 1 的 定量 进行 传输 。 每 个 发 送 端 都 保持 一 个 拥 
塞 窗 口 (congestion window) ， 对 其 可 以 在 网 络 上 同时 传输 的 未 
完成 /未 确认 的 数据 包 数 量 进行 限制 。 窗 口 大 小 越 大 ， 人 允许 的 未 完成 数 
据 包 就 越 多 : 如 果 窗 口 大 小 是 3， 那 么 在 发 送 端 必须 暂停 并 等 待 确认 包 


返回 之 前 ， 可 以 最 多 发 送 三 个 数据 包 。 你 可 以 在 图 13-4 中 看 到 : 发 送 
端 每 收 到 一 个 新 的 确认 ， 窗 口 便 癌 右 侧 滑 动 一 个 数据 包 ， 人 允许 发 送 一 
个 新 数据 包 。 因 为 这 种 行为 ， 它 有 了 时 被 称 为 “滑动 窗口 ”。 
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图 13-4 


注 ， 对 于 每 个 正确 接收 的 确认 ， 拥 塞 窗口 会 向 右 滑动 一 个 数据 包 ， 人 允许 终端 主机 将 另 一 个 数 
据 包 发 送 到 网 络 中 

TCP 的 滑动 窗口 类 似 于 第 7 章 开头 提 到 的 网 飞 的 DVD 租 任 方 法。 网 
飞 允 许 租赁 少 一 次 之 走 固定 数量 的 电影 ， 这 个 数量 取决 于 他 们 每 月 支 
付 多 少 费 用 。 他 们 付 的 钱 越 多 ， 吏 能 同时 市 走 越 多 的 电影 ， 可 以 说 ， 
这 给 了 他 们 更 大 的 “窗口 ”。 如 果 一 个 人 取 走 了 最 大 限额 的 DYD， 他 必 
须 先 归还 一 张 DVD， 才 能 拿 走 另 一 张 。 


扩大 和 缩小 窗口 大 小 
如 采 拥 塞 窗口 是 调和 流量 的 手段 ， 那 么 它 如 何 适 应 网 络 条 件 ? 


如 果 发 射 器 没有 感知 任何 拥塞 ， 则 应 该 允许 窗口 大 小 扩大 ， 以 使 
网 络 供应 得 到 最 佳 利 用 。 否 则 ， 我 们 将 不 能 充分 利用 分 组 交换 的 效 
率 。 让 我 们 明确 一 点 : 增加 窗口 和 滑动 窗口 是 不 同 的 ， 它 除了 向 前 滑 
动 外 ， 还 会 变 得 更 大 。 在 网 飞 的 DVD 类 比 中 ， 滑 动 窗口 就 像 是 归还 一 
张 DVD， 增 加 窗口 大 小 就 像 订购 更 高 限额 的 DVD 服务 。 


TCP 的 一 个 常见 目标 ， 是 在 当前 窗口 内 所 有 数据 包 痢 被 正确 接收 
后 ， 以 1 为 单位 线性 增加 窗口 大 小 。 因 此 ， 如 采 窗 口 大 小 为 3， 当 发 送 
端 收 到 3 个 数据 包 的 确认 后 ， 窗 口 可 能 会 增加 到 4。 然 后 ， 一 旦 4 个 数据 
包 被 确认 ， 窗 口 将 增加 到 5， 以 此 类 推 ， 如 图 13-5 所 示 。 更 多 天 于 如 何 
实现 线性 增加 的 信息 ， 请 参考 本 书 网 站 Q13.1 部 分 。 
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图 13-5 


注 ， 最初 (时间 1) ， 窗 口 是 3， 所 以 发 送 端 通过 网 络 发 送 三 个 数据 包 。 接 收 端 收 到 每 个 数据 
包 (时 间 2) ， 并 依次 发 送 确 认 。 当 发 送 端 收 到 三 个 确认 (时 间 3) 后 ， 它 的 窗口 增加 到 4 

与 此 相反 ， 当 拥塞 出 现时 ， 窗 口 大 小 会 减少 。 对 于 其 发 送 的 下 一 
个 满 窗 数据 包 ，TCP 通 常 不 十 线性 减少 窗口 大 小 ， 而 古 试 图 成 倍 减 
少 ， 确 切 地 说 是 减少 一 半 。 因 此 ， 如 采 窗 口 定 8 时 ， 终 端 主机 检测 到 拥 
塞 ， 它 可 能 会 减少 到 4。 如 采 在 下 一 个 数据 包 中 仍然 检测 到 拥塞 ， 则 窗 
口 数 可 能 减少 到 2， 以 此 类 推 。 这 种 成 倍 减 少 的 数量 级 ， 和 我 们 在 第 2 
章 看 到 的 Wi-Fi 设 备 在 碰撞 后 退 吉 的 情况 相同 。 记 得 那里 也 有 一 个 用 于 
调 广 Wi-Fi 传 输 的 窗口 ， 只 是 对 于 Wi-Fi 来 说 ， 更 高 的 竞争 窗口 意味 痢 
更 低频 率 的 传输 ， 而 对 于 TCP 来 说 ， 更 高 的 拥塞 窗口 意味 着 更 高 的 传 
输 速率 。 


对 拥塞 窗口 大 小 进行 加 法 式 增加 和 乘法 式 减少 ， 意 味 着 对 数据 包 
注入 网 络 的 控制 是 保守 的 。 如 果 两 者 操作 方式 相反 ， 它 将 更 加 积极 : 
乘法 式 增加 和 加 法 式 减少 。 事 实 上 ， 在 拥塞 避免 (congestion 
avoidance) 阶段 之 前 ，TCP 通 常 有 一 个 慢 启 动 (slow start) 阶 
段 ， 当 终端 主机 之 间 的 连接 初次 建立 时 ， 窗 口 的 大 小 会 更 积极 地 增 
加 。“ 快 启动 * 可 能 是 形容 这 段 时 间 更 合适 的 名 称 ， 因 为 在 此 期 间 ， 窗 
口 会 迅速 上 升 到 合理 值 。 


那么 ,终端 主机 一 开始 究竟 如 何 推断 是 否 有 拥塞 ? 毕竟， 它们 不 
知道 网 络 是 什么 样子 的 。 它 们 不 知道 自己 的 数据 包 选 择 什么 路 径 ， 还 
有 哪些 终端 主机 与 它们 共享 链接 ， 或 哪些 沿 着 路 径 的 链接 是 拥挤 的 。 
它们 只 有 通过 收 到 的 确认 数据 包 才 能 了 解 情况 ， 但 它们 都 必须 做 出 合 
理 猜测 .它们 的 连接 钙 否 在 网 络 中 的 某 个 地 方 会 过 到 拥塞 ? 这 是 网 络 
中 分 布 式 协 调 的 挑战 ! 


如 何 推 肠 拥 增 ? 


多 年 来 ， 人 们 提出 了 许多 拥塞 控制 算法 ， 其 中 的 一 部 分 已 经 在 广 
泛 部 车 的 系统 中 实现 。 所 有 主要 算法 都 使 用 负 反 馈 控 制 的 滑动 窗口 来 
调 市 传输 速率 。 它 们 之 间 的 区 别 在 于 如 何 推断 拥塞 ， 这 对 窗口 大 小 的 
更 狐 具 有 不 同意 义 。 


数据 包 丢 失 成 为 信号 


拥塞 控制 的 最 早 版 本 是 1988 年 推出 的 TCP 太 浩 ， 其 稍微 修改 后 的 
版 本 是 1990 年 推出 的 TCP 里 诺 (TCP Reno) (得 名 于 内 华 达 州 太 
浩 湖 附近 的 城市 里 诺 ) 。 它 们 做 出 一 个 重要 假设 : 如 果 发 生 数 据 包 丢 
失 ， 那 么 陇 会 出 现 拥 塞 。 这 上 听 起 来 很 合理 。 乍 一 看 ， 这 也 很 容易 实 
现 : 由 于 成 功 的 确认 意味 着 数据 包 被 传递 ， 那 么 缺少 确认 应 该 表示 数 
据 包 丢失 。 但 是 ， 我 们 如 何 确定 没有 发 送 确 认 呢 ? 也 许 它 只 是 延迟 ， 
或 者 可 能 发 送 了 确认 ， 但 它 在 返回 的 路 上 丢失 。 


TCP 使 用 两 个 符合 常识 的 估计 ， 对 数据 包 是 否 丢 失 进行 合理 猜 
测 。 第 一 个 是 : 如 果 发 送 端 等 待 很 长 时 间 ， 并 且 数 据 包 的 确认 没有 返 
回 ， 数 据 包 便 可 能 丢失 。 多 长 时 间 算 “长 "? TCP 基 于 发 送 端 和 接收 端 
之 间 的 往返 时 间 (round-trip time) (简称 RTT) ， 设 置 超时 计数 
器 。 往 返 时 间 是 数据 包 到 达 接 收 端 需 要 的 时 间 ， 加 上 该 数据 包 确 认 返 


回 发 送 端 需要 时 间 之 和 。 超 时 计数 亏 数 值 可 能 是 正 稼 往返 时 间 的 3 倍 ， 
这 样 束 可 以 留 出 足够 的 时 间 来 看 数据 包 十 否 只 是 延迟 了 。 


正常 ”的 往返 时 间 是 什么 ?这 是 一 个 数据 包 在 合理 网 络 条 件 ( 即 
没有 大多 拥 窗 下 的 往返 时 间 。 。 发送 郁 经 历 最 小 的 最 近 往 返 时 间 值 可 
以 大 致 理解 为 无 堵塞 的 正常 往返 时 间 。 


你 可 以 在 图 13-6 中 看 到 推断 拥塞 的 第 一 个 规则 的 例 于 。 发 送 端 和 
接收 端 建立 TCP 连 接 10 训 秒 后 ， 发 送 端 发 送 两 个 数据 包 。 途 中 ， 在 25 
室 秒 时 ， 第 二 个 数据 包 遇 到 延迟 ， 最 终 被 丢弃 。 “第 一 个 烧 据 包 在 35 电 
秒 后 到 达 目 的 地 ， 发 送 端 在 60 训 秒 时 收 到 确认 。 这 个 数据 包 的 往返 时 
间 是 发 送 和 确认 时 间 之 间 的 差 值 : 60 - 10 = 50 毫 秒 。 发 送 端 可 以 使 用 
一 些 最 近 观 测 到 的 往返 时 间 平 均值 “如 50 毫 秒 ) 作为 正常 往返 时 间 。 
在 该 数值 大 约 3 倍 时 间 后 ， 如 150 毫 秒 ， 数 据 包 2 将 会 超时 ， 发 送 端 会 
(理所当然 地 ) 假定 它 已 经 丢失 。 
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和 认 
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图 13-6 


注 : 一 个 数据 包 在 很 长 时 间 《如 正常 往返 时 间 的 3 倍 ) 后 未 得 到 确认 ， 就 可 能 已 经 丢失 。 在 这 
个 例子 中 ， 数 据 包 1 在 发 送 50 富 秒 后 被 确认 ， 而 数据 包 2 将 最 终 超时 ， 并 被 宣布 壬 类 


第 二 个 估计 是 : 如 果 发 送 端 在 等 竺 一 个 数据 包 的 确认 时 ， 收 到 了 
之 后 发 送 的 几 个 数据 包 的 确认 ， 那 么 这 个 未 确认 的 数据 包 可 能 已 经 丢 
失 。 由 于 每 个 数据 包 在 传输 之 前 被 分 配 了 序列 号 ，TCP 便 可 以 跟踪 传 
输 顺 序 。 运 用 这 个 方法 ， 它 可 以 得 知 数 据 包 1 最 和 完 发 送 ， 数 据 包 2 其 
次 ， 以 此 类 推 。 


你 可 以 在 图 13-7 中 看 到 此 示例 ， 其 中 发 送 端 正在 等 待 数 据 包 9 的 确 
认 。 它 开始 得 到 数据 包 9 之 后 发 送 的 几 个 数据 包 (编号 10、11、12) 的 
确认 ， 但 仍 没 有 来 自 数据 包 9 的 确认 。 当 然 ， 数 据 包 9 可 能 走 过 了 一 条 
不 同 的 路 径 ， 往 返 时 间 更 长 。 但 如 有 果 之 后 多 达 3 个 数据 包 的 确认 都 已 经 
到 达 ， 该 数据 包 很 可 能 不 仅仅 是 迟到 ， 而 是 丢失 了 。 对 于 分 布 式 协调 
来 说 ， 这 些 都 是 非常 答 单 但 很 聪明 的 方法 。 
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图 13-7 


注 : 如 果 一 个 数据 包 在 之 后 几 个 数据 包 得 到 确认 后 ， 仍 然 没 有 确认 ， 则 可 能 已 丢失 。 在 这 个 
例子 中 ， 发 送 端 在 序列 中 的 第 九 个 数据 包 之 后 ， 收 到 三 个 数据 包 的 确认 ， 因 此 可 以 假设 数据 
包 9 已 经 丢失 

基于 技 包 的 拥塞 推 新 是 近 10 年 来 的 标准 ， 但 这 种 方法 没有 考虑 到 
儿 个 因素 。 一 方面 ， 除 了 拥塞 外 ， 还 有 其 他 因素 可 能 导致 数据 包 丢 
失 : 信道 质量 差 。 这 对 于 无 线 网 络 尤 其 如 此 。 记 得 在 第 一 部 分 ， 我 们 
谈 到 的 手机 信号 相互 干扰 和 Wi-Fi 传 输 磁 接 吗 ? 这 两 种 情况 都 可 能 导致 
大 量 数 据 包 丢失 ， 但 它们 并 不 表示 互联 网 内 部 出 现 拥塞 。 实 际 上 ， 有 
很 多 人 建议 采用 TCP 无 线 ， 以 减轻 这 些 问题 。 


基于 丢失 的 推 新 的 另 一 个 问题 是 ， 当 数据 包 被 丢弃 时 ， 对 拥塞 做 
出 反应 往往 已 经 太 晚 。 拥 挤 的 路 径 上 的 许多 剩余 数据 包 可 能 也 开始 被 
丢弃 ， 以 迫使 发 送 端 重 狐 发 送 。 这 种 情况 可 以 通过 切换 到 另 一 个 推断 
言 号 加 以 缓解 ， 我 们 将 在 下 一 节 讨 论 。 


数据 包 延 迟 成 为 反馈 


在 太 浩 和 里 诺 之 后 ，TCP 韦 加 斯 (TCP Vegas) 于 1995 年 被 发 
明 。 除 了 以 内 华 达 州 的 另 一 个 地 方 (这 次 是 它 最 大 的 城市 ) 命名 ， 
TCP 韦 加 斯 推出 了 一 个 控制 拥塞 的 狐 模 式 ， 使 用 数据 包 延 迟 ， 而 不 是 
数据 包 丢 失 ， 作 为 推 朵 信号。 


怎样 对 延迟 进行 测量 ? 也 许 发射 希 可 以 将 数据 包 的 往返 时 间 与 之 
前 讨论 的 正常 往返 时 间 比 较 。 这 似乎 是 正当 的 〈 实 际 上 也 是 ) ， 但 原 
因 并 不 简单 ， 因 为 (主要) 有 两 种 延迟 影响 数据 包 的 往返 时 间 ， 而 其 
中 只 有 一 种 指示 拥塞。 你 可 以 在 图 13-8 中 看 到 这 些 组 成 部 分 。 即 使 在 
网 络 中 没有 其 他 数据 包 ， 仍 然 会 有 传播 延迟 (propagation 
delay) ， 这 与 跨越 从 发 送 端 到 接收 端的 链接 相关 。 信 息 从 链接 一 端 
到 男 一 问 的 速度 并 不 真正 取决 于 拥塞 ， 而 是 由 建立 链接 的 硬件 质量 决 
定 ， 并 且 受 到 物理 基本 定律 的 限制 。 真 正 随 拥塞 情况 变化 的 是 排队 延 
迟 (queueing delay) ， 也 就 是 数据 包 在 链接 之 间 的 路 由 器 缓冲 区 
等 待 的 时 间 。 拥 塞 越 严 重 ， 缓 冲 区 行 数 越 长 ， 每 个 数据 包 在 链接 可 用 
之 前 等 待 的 时 间 就 越 长 。 

所 排队 延 开 > < 排队 延迟 地 


< 一 传播 延迟 一 一 zz 


图 13-8 数据 包 的 往返 时 间 有 两 个 主要 部 分 : 传播 延迟 和 排队 延迟 


关键 是 ， 我 们 可 以 预计 往返 时 间 的 任何 变化 都 由 排队 延迟 导致 。 
链接 上 的 传播 延迟 将 在 小 的 时 间 尺 度 上 大 致 保持 不 变 。 这 使 得 延迟 成 
为 判断 拥塞 条 件 的 准确 信号 。 


数据 包 丢失 有 是 二 元 度量 方法 。 它 为 终端 主机 提供 了 两 种 可 能 性 : 
拥塞 产生 (数据 包 被 丢弃 ) 或 没有 产生 (数据 包 未 被 丢弃 ) 。 延 迟 允 
许 终端 主机 将 拥塞 程度 考虑 在 内 。 如 有 果 延 迟 比 预期 的 稍 多 ， 那 么 窗口 
大 小 可 以 稍微 减少 。 如果 延 迟 比 预期 的 多 很 多 ， 窗 口 大 小 可 以 大 幅 减 
少 。 同 样 ， 如 采 延 迟 比 预期 的 要 少 ， 窗 口 大 小 也 可 以 被 相应 增加 。 


换 句 话说 ， 相 比 等 到 数据 包 丢 失 ， 基 于 延迟 的 推断 允许 终端 主机 
啊 应 拥塞 的 最 初 迹象 。 你 可 以 在 图 13-9 中 看 到 一 个 示例 ， 其 中 发 送 端 
已 将 四 个 数据 包 发 送 给 一 个 接收 端 ， 彼 此 相 隅 很 短 时 间 。 确 认 表 明 ， 
收 到 这 些 数据 包 的 延迟 逐渐 增加 ， 往 返 时 间 依 次 为 50、60、80 芝 秒 。 
第 四 个 数据 包 彻 底 丢 失 。 利 用 基于 延迟 的 信号 ， 发 送 端 可 以 在 往返 时 
间 开 始 增加 时 ， 逐 步 应 对 这 种 情况 ， 并 在 往返 时 间 逐 渐 增 长 时 ， 使 窗 
口 大 小 急剧 减 小 。 利 用 基于 丢失 的 推 新 ， 发 送 端 会 等 到 第 四 个 数据 包 
丢失 ， 这 对 于 防止 进一步 和 更 严重 的 延迟 和 丢失 来 说 为 时 已 晚 。 
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图 13-9 
注 : 通过 基于 延迟 的 推断 ， 发 送 端 将 为 每 个 数据 包 的 测量 往返 时 间 (RTT) 调整 窗口 大 小 ， 


而 对 于 基于 丢失 的 推断 ， 它 直到 第 四 个 数据 包 被 宣布 丢失 才 会 减 小 窗口 大 小 


TCP 韦 加 斯 之 后 ， 在 过 去 20 年 中 ， 人 们 提出 并 在 TCP 中 实施 了 许 
多 其 他 拥塞 控制 算法 。2002 年 推出 的 快速 TCP (FAST TCP) 基于 
估计 延迟 ， 对 拥塞 窗口 调整 方式 进行 修改 ， 并 帮助 稳定 拥塞 控制 。 
2005 年 推出 的 立方 TCP (CUBIC TCP) 结合 基于 丢失 和 基于 延迟 
的 信号 ， 成 为 Linux 操 作 系统 的 默认 算法 ， 直 到 2012 年 被 TCP 速 率 比 
例 缩减 〈TCP Proportional Rate Reduction) 取代 。 


既然 我 们 理解 了 拥塞 控制 的 核心 思想 ， 让 我 们 来 看 看 下 面 两 个 算 
法 的 例子 。 


TCP 里 诡 : 侦探 的 细 下 


在 推出 1/4 个 世纪 后 ， 基 于 丢失 的 拥塞 控制 算法 TCP 里 诡 仍 受到 广 
泛 使 用 ， 不 过 它 多 年 来 已 做 出 一 些 改进 。 其 主要 操作 其 实 很 简单 。 对 
于 每 个 满 窒 的 数据 包 ， 发 送 端 都 会 思考 : 它们 全 都 被 正确 接收 了 吗 ? 


. 如 果 是 ， 那 么 它 会 将 窗口 大 小 增加 1; 
. 如 果 不 是 ， 那 么 它 会 将 窗口 大 小 减 小 一 半 。 


一 个 数据 包 被 “正确 接收 ”基于 我 们 之 前 讨论 的 两 个 估计 : 确认 返 
回 需 要 满足 (1) 在 合理 的 时 间 内 ; (2) 按照 与 最 初 传输 相应 的 序 
人 。 按照 这 个 逻辑 ， 当 (1) 已 经 超过 一 定 的 往返 时 间 ， 或 〈2) 如 果 

定数 量 的 后 续 数 据 包 已 被 确认 ， 那 么 发 送 端 便 可 以 假设 一 个 数据 包 
丢失 。TCP 里 诺 还 有 其 他 更 微妙 的 功能 ， 但 我 们 在 本 书 中 没有 时 间 讨 


论 。 


我 们 将 看 到 一 个 例子 ， 有 末了 解 这 个 鼻 沙 的 主要 操作 。 为 简单 起 
， 假 设 每 个 数据 包 的 往返 时 间 是 相同 的 ， 这 意味 着 在 一 个 满 窗 中 的 


所 有 数据 包 的 确认 将 同时 被 接收 。 时 间 1 表示 一 个 往返 时 间 过 去 ， 时 间 
2 表示 另 一 个 过 去 ， 以 此 类 推 。 在 现实 中 ， 一 个 往返 时 间 在 美国 通常 约 
为 50 毫 秒 ， 它 随 着 拥塞 状况 的 变化 而 明显 变化 ， 在 不 同 数据 包 之 间 也 
不 一 样 。 


当 发 送 端 与 接收 涡 建 并 会话 ， 假 设 刚 开始 窗口 大 小 为 5: 


“ 此 时 ， 它 发 出 一 个 满 窗 共 5 个 数据 包 ， 然 后 停顿 。 

“在 时 间 1， 发 送 端 得 到 所 有 5 个 数据 包 的 确认 。 它 将 窗口 同 右 
请 动 5， 使 窗口 大 小 增加 1， 增 加 到 6， 并 发 出 6 个 数据 包 。 

“在 时 间 2， 如 果 发 送 端 收 到 所 有 6 个 数据 包 的 确认 ， 会 发 生 什 
么 ? 它 将 窗口 滑动 6， 使 窗口 大 小 增加 到 7， 并 发 出 7 个 数据 包 。 

“ 在 时 间 3， 如 采 它 再 次 成 功 ， 窗 口 大 小 则 变 为 8 。 

“ 在 时 间 4， 假 设 所 有 确认 都 已 返回 ， 除 了 第 三 个 。 由 于 其 后 5 
个 数据 包 都 已 经 得 到 确认 ， 因 此 发 送 端 将 宣布 第 三 个 丢失 。 所 以 ， 
它 将 窗口 大 小 减 半 至 4， 这 次 只 发 送 4 个 数据 包 。 你 可 以 在 图 13-10 
中 看 到 。 

*“ 在 时 间 5， 发 送 端 收 到 这 4 个 数据 包 的 确认 。 因 此 ， 它 消 动 并 
增加 窗口 ， 然 后 发 送 5 个 数据 包 。 


图 13-10 


注 : 在 时 间 3， 窗 口 大 小 从 = 77 增 加 到 8， 发 送 端 可 以 发 送 8 个 数据 包 。 当 其 中 一 个 数据 包 被 检 
测 为 丢失 ， 在 时 间 4， 窗 口 减 半 至 4 


最 初 5 个 往返 时 间 的 窗口 大 小 变化 ， 以 及 之 后 可 能 变化 的 情况 ， 如 
图 13-11 所 示 。 如 有 果 你 对 图 中 显示 的 剩 下 4 个 往返 时 间 的 变化 原因 感 兴 
趣 ， 请 参考 本 书 网 站 Q13.2 部 分 。 基 本 结论 是 ， 当 没有 数据 包 丢失 时 ， 
窗口 大 小 呈 线 性 增长 ， 而 当 发 生 数据 包 丢 失 (在 时 间 4 和 7) 时 ， 窗 口 
大 小 急剧 下 降 。 
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窗口 大 小 


Dm 人 % 


往返 时 间 
图 13-11 
利用 TCP 里 诺 ， 窗 口 不 是 线性 增加 〈 无 数据 包 丢 失 ) ， 就 是 乘法 式 减少 《有 数据 包 丢 


TCP 韦 加 斯 : 侦探 的 细节 


为 了 对 比 ， 让 我 们 仔细 了 解 一 下 第 一 代 基 于 延迟 的 拥塞 控制 算法 
一 一 TCP 韦 加 斯 。 它 已 经 在 一 些 计算 机 操作 系统 中 实现 ， 包 括 Linux 和 
FreeBSD。 


TCP 韦 加 斯 使 用 观测 到 的 往返 时 间 来 确定 当前 窗口 大 小 的 吞吐 
率 ， 也 束 是 每 秒 有 多 少数 据 包 被 确认 。 ee 网 络 中 〈 几 
乎 ) 没有 拥塞 时 所 能 预期 的 吞吐 率 ， 它 给 出 最 低 的 往返 时 间 。 对 于 每 
个 数据 包 的 确认 ， 终 端 主机 会 问 : 前 的 窗 站 天 小 目前 的 吞吐 量 
与 理想 吞吐 量 相 比 如 何 ? 


“ 如 有 果 吞 吐 量 太 接近 理想 吞吐 量 ， 终 端 主机 会 将 窗口 大 小 增加 


。 如 有 果 吞 吐 量 距 离 太 远 ， 它 会 将 窗口 大 小 减 小 1。 
。 如 果 吞 吐 量 刚 好 合适 〈 既 不 太 近 也 不 太 远 ) ， 它 将 不 改变 窗 
口 大 小 。 


合适 吞吐 量 是 某 个 规定 的 国 值 ， 如 3。 郑 值 低 于 3 则 太 近 ， 高 于 3 册 


A 


最 终 ， 如 果 算 法 经 过 适当 微调 ， 网 络 应 该 会 达到 平衡 ， 其 中 每 个 
发 送 端 都 会 获得 合适 的 吞吐 量 ， 直 到 有 新 的 变化 ， 如 建立 新 的 会 话 ， 
此 时 这 个 程序 将 寻找 新 的 平衡 。 在 平衡 状态 下 ， 网 络 处 于 效用 的 “ 完 
美 ?水 平 ， 没 有 太 多 拥塞 ， 所 以 窗口 大 小 将 停止 改变 。 当 然 ， 网 络 动态 
的 现实 使 "平衡 ?成 为 一 种 理想 。 


实现 对 多 用 户 发 送 速率 平衡 育 后 的 数学 计算 对 于 本 书 来 说 太 高 级 
了 一 点 。 在 任何 情况 下 ， 要 达到 平衡 ， 所 有 主机 都 遵循 协议 是 非常 重 
要 的 。 如 采 一 个 发 送 端 决 定 从 约定 地 点 增加 其 传输 速率 ， 这 可 能 不 会 

影响 拥塞 状况 ， 但 会 对 其 他 所 有 人 不 公平 。 如 果 别 人 也 决定 提高 

率 ， 拥 塞 会 变 得 闫 重 ， 很 快 它 们 都 会 处 于 比 以 前 更 糟糕 的 状态 。 
许 会 使 你 想起 ， 我 们 在 第 一 部 分 谈 到 使 网 络 资 源 得 到 有 效 共 至 的 不 同 
方法 。 在 单元 中 控制 传输 功率 和 在 互联 网 中 控制 拥塞 有 不 同 的 目的 ， 
但 其 工作 原理 都 是 相同 的 : 让 每 个 设备 根据 其 收 到 的 有 关 网 络 条 件 的 


有 反馈， 调整 目 己 的 水 平 ， 以 实现 平衡 。 如 果 没 有 适当 的 协议 ， 互 联网 
可 能 会 像 第 3 章 公 地 悲剧 中 耗 尽 的 牧场 那样 。 图 13-12 显 示 了 拥塞 控制 
的 分 布 式 特性 ， 你 可 以 将 其 与 第 1 章 的 图 1-17 比 较 。 
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注 : 拥塞 控制 是 以 分 布 式 的 方式 来 完成 的 ， 每 个 终端 主机 都 通过 负 反 馈 探 制 窗口 大 小 


最 后 ， 让 我 们 从 头 到 尾 分 析 TCP 韦 加 斯 的 一 个 例子 。 为 简单 起 
见 ， 假 设 最 小 往返 时 间 从 未 改变 ， 固 定 在 50 唉 秒 。 现 实情 况 并 非 如 
此 ， 发 送 剖 将 基于 先前 测量 值 的 动态 调整 这 一 最 小 值 。 我 们 也 会 把 时 
间 单 位 看 成 数据 包 确 认 到 达 的 时 间 ， 所 以 每 一 步 都 对 应 一 次 窗口 大 小 
更 新 。 


当 会 话 建立 ， 假 设 和 里 庄 的 例子 一 样 ， 发 送 端 开始 的 窗口 大 小 为 


* 最 初 ， 终 端 主机 发 出 5 个 数据 包 ， 然 后 停顿 。 


。 在 时 间 1， 第 一 个 数据 包 返 回 ， 往 返 时 间 为 51 室 秒 。 目 前 知 
吐 量 为 : 
5 包 / 51 之 秒 = 98.03 包 / 秒 


无 拥塞 否 吐 量 为 : 


5 包 / 50 训 秒 = 100 包 / 秒 


差 值 为 100 - 98.03 = 1.97， 小 于 3， 所 以 窗口 大 小 增加 1 至 6。 由 于 
现在 有 4 个 未 完成 数据 包 ， 因 此 终端 主机 会 再 发 送 两 个 ， 共 计 6 个 。 你 
可 以 在 图 13-13 中 看 到 。 


窗口 = $ 


.i 
DI 


Vv 窗口 = 6 (增加 ) 
| 
滑动 ) Tr 


未 完成 发 送 


接收 
差 值 = 阅 值 


时 间 


图 13-13 
注 : 当 拥塞 窗口 大 小 增加 时 ， 终 端 主机 再 发 出 两 个 数据 包 ， 比 上 个 数据 包 回 来 之 前 多 一 个 


。 第 二 个 数据 包 在 时 间 2 返 回 ， 往 返 时 间 为 50.5 毫 秒 。 吞 吐 量 是 
多 少 ? 目前 吞吐 量 为 6 包 / 50.5 毫 秒 = 118.81 包 / 秒 ， 而 无 拥塞 吞吐 量 
为 6 包 / 50 训 秒 = 120 包 / 秒 。 差 值 为 120 - 118.81 = 1.19， 同 样 小 于 
3。 窗 口 大 小 增加 到 7， 再 次 发 送 两 个 数据 包 。 

。 在 时 间 3 和 4， 第 三 个 和 第 四 个 数据 包 返 回 。 假 设 它们 的 往返 
时 间 叉 使 窗口 大 小 增加 。 然 后 ， 窗 口 大 小 将 变 成 9。 


“在 时 间 5， 第 五 个 数据 包 的 往返 时 间 为 50.8 训 秒 ， 这 使 得 当前 
吞吐 量 为 9 包 / 50.8 毫 秒 s177 包 / 秒 ， 无 拥塞 吞吐 量 为 9 包 / 50 毫 秒 = 
180 包 / 秒 。 差 值 大 约 为 ?3， 所 以 窗口 大 小 保持 不 变 ， 终 端 主机 发 送 
一 个 数据 包 。 你 可 以 在 图 13-14 中 看 到 这 个 滑动 窗口 。 

。 在 时 间 6， 第 六 个 数据 包 返 回 ， 往 返 时 间 为 51.8 毫 秒 。 知 吐 量 
是 多 少 ? 目前 是 9 包 / 51.8 毫 秒 = 173.7 包 / 秒 ， 而 无 拥塞 吞吐 量 和 以 
前 一 样 ， 为 180。 差 值 180 - 173.7 = 6.3， 现 在 大 于 3。 因 此 ， 窗 口 
大 小 减 小 到 8， 没 有 数据 包 被 发 送 ( 见 图 13-15) 。 
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注 : 当 拥塞 窗口 大 小 不 变 ， 终 端 主机 会 发 出 一 个 数据 包 
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图 13-15 
注 ， 当 拥塞 窗口 大 小 减少 ， 终 端 主 机 不 会 发 送 任何 数据 包 


这 些 往返 时 间 中 每 一 个 的 拥塞 窗口 及 其 之 后 可 能 如 何 变 化 ， 如 图 
13-16 所 示 。 如 果 你 对 时 间 7~13 中 导致 这 种 行为 的 原因 感 兴趣 ， 请 参考 
本 书 网 站 Q13.3 部 分 。 其 中 有 明显 的 上 上升、 平稳、 下降、 平稳、 上升 等 
模式 ， 和 我 们 在 第 1 章 功率 控制 的 例子 ( 见 图 1-16) 中 看 到 的 传输 功率 
水 平 类 似 。 我 们 预计 会 出 现 这 种 基于 延迟 的 拥塞 控制 行为 : 如 条 网 络 
没有 得 到 充分 利用 ， 往 返 时 间 太 短 ， 束 表示 终端 主机 可 以 发 送 更 多 数 
据 包 。 如 果 网 络 使 用 过 度 ， 往 返 时 间 太 长 ， 融 说 明 终 端 主机 应 该 减少 
发 送 。 当 关 值 和 靖 值 相同 ， 窗 口 大 小 就 不 会 改变 ， 束 像 处 于 分 布 式 功 
率 控 制 下 的 手机 在 得 到 其 所 需 的 信号 干扰 比 时 ， 不 会 改变 其 传输 功率 
一 样 。 负 反馈 是 强大 的 ! 


时 间 


确认 
图 13-16 
注 : 通过 TCP 韦 加 斯 ， 对 于 每 个 接收 到 的 确认 ， 窗 口 大 小 增加 1， 减 少 1， 或 保持 不 变 


作为 这 些 算法 行为 的 总 结 ， 图 13-17 显 示 了 随 着 时 间 的 推移 ，TCP 
里 诺 和 TCP 韦 加 斯 拥塞 窗口 大 小 的 典型 变化 。 你 可 以 看 到 ，TCP 里 诺 
采用 基于 丢失 的 信号 ， 不 断 重复 上 升 至 过 于 激进 的 速率 (导致 网 络 链 
路 拥塞 ) 又 乘法 式 下 降 到 较 低 水 平 (导致 网 络 资源 利用 不 足 ， 的 过 
程 。 当 我 们 使 用 基于 延迟 的 拥塞 控制 算法 TCP 韦 加 斯 时 ， 这 种 “ 锯 
齿 ” 一 般 会 减少 并 变 得 平滑 。 丢 失 是 二 元 “是 或 否 ” 的 信号 ， 而 延迟 往往 
让 我 们 更 加 快速 和 平滑 地 对 拥堵 做 出 反应 ， 只 要 算法 的 参数 调整 恰 
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图 13-17 


注 ，TCP 里 诺 和 TCP 韦 加 斯 拥塞 窗口 值 的 典型 模式 。 里 诺 中 网 络 资源 过 度 利用 和 利用 不 足 之 间 
的 锯齿 往 往 在 韦 加 斯 中 变 得 更 小 、 更 平滑 

在 前 面 三 章 ， 我 们 讨论 了 互联 网 背后 的 一 些 显著 的 知识 形势 。 我 
们 开始 了 解 其 设计 背后 的 三 个 基本 概念 : 分 组 交换 、 分 布 式 层 次 结构 
和 模块 化 。 然 后 ， 我 们 详细 讨论 了 互联 网 需要 处 理 的 两 个 主要 功能 : 
路 由 ， 通 过 网 络 内 逐 跳 实现 ;拥塞 控制 ， 由 网 络 边缘 的 设备 通过 端 到 
端 实现 。 作 为 协议 栈 的 “ 细 腰 ”，TCP/P 将 下 面 的 功能 模块 〈 如 物理 层 
和 链接 层 ) 与 上 面 的 模块 (如 应 用 层 ) 粘连 起 来 。 作 为 细 腰 的 一 部 
分 ，TCP 的 拥塞 控制 设计 和 IP 的 路 由 设计 带 来 了 巨大 的 成 功 。 尽 管 互 
联网 在 地 域 分 布 中 不 断 增长 ， 处 理 的 功能 越 来 越 多 ， 应 对 的 需求 不 断 
增加 ， 但 互联 网 仍然 没有 骨 尝 ， 这 都 要 归功 于 这 些 能 力 。 


这 里 的 目标 不 是 掌握 数学 模型 或 工程 细 方 。 对 于 那些 ， 有 完整 的 
课程 甚至 整个 学 位 课程 项 目 专门 针对 协议 栈 中 的 层 。 相 反 ， 我 们 想 强 
调 互联 网 背后 的 基本 原则 ， 以 及 路 由 和 拥塞 控制 如 何 工 作 。 


第 14 章 
在 小 世界 中 航行 


互联 网 及 其 推动 的 社交 网 络 是 巨大 的 ， 我 们 每 个 人 只 直接 连接 到 
其 中 一 小 部 分 。 正 如 我 们 在 第 10 章 中 看 到 的 ，2015 年 ， 普 通 脸 书 用 户 
只 跟 网 站 上 的 16.5 亿 人 中 的 大 约 350 人 是 “好 友 ”。 但 陌生 人 往往 可 以 通 
过 很 小 的 短路 径 进 行 连接 。 脸 书 中 两 个 人 之 间 的 平均 分 离 度 不 超过 四 
跳 。 在 网 络 相 对 两 端的 人 之 间 ， 怎 么 会 目 然 存 在 这 么 短 的 端 到 端 路 
径 ? 正如 我 们 将 看 到 的 ， 这 取决 于 社会 网 络 的 组 织 方式 以 及 人 们 搜索 
短 距离 的 方式 。 


毕竟 这 是 一 个 小 世界 


1967 年 ， 美 国 社会 心理 学 家 斯 坦 利 : 米 尔格 拉 姆 进行 了 一 项 实验 ， 
揭 开 小 世界 (small-world) 现象 的 序幕 ， 这 或 许 被 更 广泛 地 称 
为 “六 度 分 隔 理论 ” (six degrees of separation) 。 它 已 成 为 科普 
书籍 中 的 一 个 流传 最 广泛 ， 有 时 也 会 被 误解 的 故事 。 


为 什么 是 六 度 ? 


米尔 格拉 姆 让 生活 在 奥马 哈 (美国 中 西部 的 内 布 拉 斯 加 州 最 大 的 
城市 ) 的 300 个 人 ， 将 一 封 看 上 去 像 护 照 的 信 传 递 给 一 个 生活 在 东海 岸 
马 院 诸 塞 州 波士顿 郊区 的 人 。 收 信人 的 姓名 、 地 址 和 职业 (股票 经 纪 
人 ) 显示 在 信封 上 。 米 尔格 拉 姆 向 参与 者 提出 一 条 重要 的 规则 : 他 们 
只 能 把 信 转 交 给 目 己 认识 并 知道 名 字 的 人 。 因 此 ， 如 果 他 们 不 认识 收 
件 人 并 知道 名 字 〈 几 乎 没有 人 知道 ) ， 就 只 能 通过 别人 来 寄 信 ， 首 先 


把 信 交 给 一 个 朋友 “一 跳 ) ， 然 后 对 方 交 给 自己 的 一 个 朋友 (又 一 
跳 ) ， 直 到 信和 最 终 传 到 某 个 知道 该 股票 经 纪 人 名 字 的 人 手 上 。 米 尔格 
拉 姆 想 知 道 ， 这 个 过 程 将 经 过 多 少 跳 ? 


可 以 想象 ， 知 道 收 信人 的 姓名 和 地 址 在 本 实验 中 是 很 重要 的 。 有 
了 这 些 信息 ， 人 们 可 以 分 析 :“ 嗯 ， 我 不 认识 收 信 人 人 本人， 但 我 认识 一 
个 住 在 波士顿 附近 的 人 ， 所 以 我 会 转交 给 他 。” 事 实证 明 ， 知 道 收 信人 
的 职业 也 发 挥 了 重要 作用 ， 这 样 束 可 以 把 信 交 给 与 他 相同 或 相似 职业 
的 人 。 你 可 以 狂 到 ， 这 些 信件 经 过 的 路 径 往往 会 看 起 来 像 图 14-1: 几 
条 远程 链接 把 信 传 到 收 信 人 附近 ， 还 有 几 条 短 距离 链接 基于 更 具体 的 
本 地 决策 ,，“ 距 离 ” 成 为 地 理 和 职业 传播 的 某 种 组 合 。 从 源 发 出 的 远程 
链接 之 后 是 到 目的 地 的 短程 本 地 链接 ， 这 可 能 使 你 想起 我 们 在 第 12 章 
讨论 的 互联 网 路 由 和 邮件 系统 的 类 比 ， 不 过 这 里 路 由 如 何 操作 和 评价 
有 重要 的 过 异 。 
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图 14-1 
注 : 两 个 距离 远 且 不 认识 彼此 的 人 ， 他 们 之 间 的 短路 径 可 能 包括 一 个 或 一 个 以 上 的 远程 链接 


结 采 怎样 ? 米尔 格拉 姆 提供 的 信件 中 ， 有 217 封 真正 送出 去 了 ， 其 
中 64 封 约 30% ) 抵达 目的 地 。 其 他 信件 可 能 丢失 在 路 上 ， 这 一 点 在 
分 析 数 据 时 需要 认真 考虑 。21 世 纪 初 ， 有 人 利用 电子 邮件 复制 了 这 次 
实验 ， 只 取得 1.5% 的 到 达 率 。 与 之 相 比 ， 米 尔格 拉 姆 取得 的 30% 的 成 


切 率 实在 令 人 印象 深刻 。 每 一 封 信 经 过 的 不 同 跳 数 如 图 14_2 所 示 : 平 
均 仅 为 52 跳 ， 而 中 位 数 (中 间 的 数 ) 仅 为 6 跳 。 这 就 是 "六 度 * 的 由 
来 ， 对 于 不 认识 彼此 的 人 来 说 ， 这 是 非常 短 的 距离 
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图 14-2 米尔 格拉 姆 的 实验 中 ， 每 封 信 到 达 目 的 地 所 经 过 的 跳 数 
注 : 中 位 (中间) 数 为 6 


研究 人 员 一 直人 怀疑 ， 社 会 距离 (social distance) ， 或 在 人 群 
中 到 达 任 何人 所 经 过 的 平均 跳 数 ， 随 人 口 规模 增 大 而 发 生 的 增长 十 分 
缓慢 。 米 尔格 拉 姆 的 结果 对 此 提供 了 证 明 。 多 年 来 ， 许 多 人 对 他 的 实 
验 结论 提出 反对 ， 声 称 基于 不 同 的 参与 对 象 、 组 织 方式 和 其 他 自由 
度 ， 实 验 将 会 取得 不 同 结果 。 但 从 20 世 纪 70 年 代 到 在 线 社交 媒体 时 
代 ， 从 人 研究 合作 者 之 间 的 埃 数 到 演员 之 间 的 联合 出 演 天 系 ， 大 量 实证 
研究 证 据 表 明 小 世界 现象 的 存在 。 其 他 大 型 研究 也 将 平均 跳 数 确 定 为 6 
或 大 约 6 次 ， 如 邓肯 : 沃 敬 在 2001 年 利用 电子 邮件 进行 的 实验 ， 以 及 
2008 年 对 微软 Messenger 用 户 之 间 即 时 信息 的 研究 。 


2016 年 2 月 ， 脸 书 用 户 之 间 的 分 隔 度 仅 为 3.57， 而 2011 年 为 4.74， 
2008 年 为 5.28。 显 然 ， 我 们 已 经 很 小 的 世界 在 网 上 正 变 得 越 来 越 小 ! 
(虽然 不 是 所 有 的 脸 书 友谊 都 属于 “知道 名 字 ” 的 友谊 。) 


小 世界 的 概念 已 经 渗透 到 流行 文化 中 ， 出 现在 电影 、 电 视 节 目 和 
歌曲 中 。 一 部 名 为 “六 度 分 隔 ” 的 电影 于 1993 年 上 映 。2007 年 ， 一 家 中 
踪 “ 六 度 的 凯 文 . 贝 肯 ” 的 网 站 (http://oracleofbacon.org/movielinks.php) 
成 立 。 它 基于 一 个 理念 :好莱坞 电影 业 中 的 任何 人 都 可 以 通过 其 电影 
角色 与 这 位 多 产 的 演员 产生 联系 。2015 年 ， 电 视 节 有 目 《 六 度 的 一 切 》 
首 映 ， 其 前 提 是 ， 主 持 人 可 以 在 六 个 步骤 以 内 ,与 人 、 事 物 或 两 者 都 
产生 联系 。 对 于 当今 最 有 趣 的 科普 主题 之 一 ， 这 些 只 是 你 可 以 找到 的 
2 区 ER 


小 世界 奇怪 吗 ? 


对 于 社会 网 络 中 看 似 普遍 的 小 世界 理论 ， 我 们 应 该 感到 惊讶 吗 ? 
表面 上 ， 你 可 以 在 六 个 或 更 少 步骤 以 内 联系 到 任何 人 ， 这 似乎 很 令 人 
惊叹 。 再 想 想 ， 你 可 能 做 出 如 下 分 析 : 如 果 你 有 20 个 朋友 ， 他 们 每 个 
人 都 有 20 个 朋友 ， 以 此 类 推 ， 那么 你 在 六 步 以 内 可 以 联系 到 
20x20x20x20x20x20 = 6 400 万 个 人 人。 按照 这 个 逻辑 ， 一 般 情况 下 六 步 
应 该 足够 。 


但 这 个 逻辑 有 一 个 缺陷 ， 因 为 它 假定 人 们 的 朋友 不 会 彼此 重 有 车 。 
你 需要 你 的 每 一 个 朋友 有 20 个 朋友 ， 其 中 不 包括 你 的 任何 其 他 朋友 ， 
也 不 包括 他 们 的 朋友 。 现 实 显然 不 是 这 样 的 :社交 网 络 充 满 了 “三 角 
形 * 或 三 角 闭 合 (triad closures) 的 关系 。 你 可 以 在 图 14-3 中 看 到 
三 角 闭 合 的 一 个 例子 : 如 果 安 娜 和 本 都 认识 查理 ， 很 可 能 他 们 也 认识 
对 方 。 


查理 


图 14-3 


注 : 如 果 安 娜 和 本 都 认识 查理 ， 很 可 能 他 们 也 认识 对 方 。 如 果 确 实 如 此 ， 这 种 关系 成 为 一 个 
三 角 闭 合 关系 


六 度 分 隔 现在 确实 令 人 惊讶 。 但 米尔 格拉 姆 式 的 小 世界 实验 表明 
更 为 有 力 的 观点 : 这 些 短路 径 不 仅 存 在 ， 每 个 人 还 可 以 利用 关于 目的 
地 非常 有 限 的 信息 及 其 自身 的 本 地 网 络 视图 发 现 它们 。 与 第 12 章 通过 
网 络 发 送 数据 包 相 比 ， 这 种 社会 化 搜索 (social search) 过 程 也 许 
更 难 ， 因 为 人 们 并 不 是 经 过 编程 来 传递 消息 以 帮助 彼此 建立 全 局 视 
图 。 他 们 拥有 的 唯一 有 用 的 信息 舱 入 在 收 信人 的 地 址 和 职业 中 ， 可 能 
也 在 收 信 人 的 姓名 中 ， 这 可 能 会 揭示 一 些 关 于 其 性 别 和 种 族 的 有 用 信 
息 。 这 至 少 可 以 提供 一 些 关 于 收 信人 在 网 络 哪 “ 端 ”的 启示 。 


根据 这 些 信息 ， 也 许 这 些 实验 的 参与 者 会 构建 其 联系 人 和 收 信人 
之 间 的 距离 度量 指标 。 例 如 ， 以 英里 测量 地 理 距 离 ， 纽 约 比 芝 加 哥 更 
靠近 波士顿 。 同样 ， 按 照 某 些 职 业 距 离 指 标 ， 财 务 顾问 可 能 比 护士 更 
接近 股票 经 纪 人 “。 这 个 指标 更 模糊 ， 但 可 以 进行 合理 量化 。 如 采 每 个 


人 真 的 基于 局 部 视图 ， 用 简单 而 “ 仿 梦 ”的 算法 来 将 信和 转交 给 最 接近 目 
的 地 的 朋友 ， 这 会 产生 一 条 最 短路 径 吗 ? 


总 结 一 下 ， 小 世界 现象 包括 两 个 部 分 : 


* 结构 方面 : 社会 网 络 可 以 以 最 初 存在 短路 径 的 方式 形成 。 


“ 算法 方面 : 利用 非常 有 限 的 本 地 信息 ， 人 能 找到 一 条 这 样 的 
呈 路 径 。 


多 年 来 ， 人 们 构建 了 各 种 模型 来 解释 这 两 种 小 世界 。 在 本 章 的 其 
余部 分 ， 我 们 将 介绍 其 中 最 受 欢 迎 的 一 种 。 


我 们 如 何 建立 一 个 图 表 来 显示 小 世界 ? 建 模 将 帮助 我 们 理解 网 络 
的 样子 ， 它 在 一 开始 吏 产 生 这 种 现象 。 我 们 需要 一 种 方式 来 获得 较 小 
的 路 径 长 度 ， 同 时 保持 一 个 真实 的 网 络 结构 。 


短 距 离 


在 本 书 中 ， 我 们 已 经 看 到 几 个 描述 网 络 的 指标 ， 从 网 络 拥有 的 市 
点 和 链接 数量 等 简单 指标 ， 到 不 同 中 心性 等 更 为 复杂 的 指标 。 用 来 总 
结 图 中 最 短路 径 的 一 个 常用 指标 是 其 直径 (diameter) ， 这 是 网 络 
中 任何 一 对 节点 之 间 最 长 的 最 短路 径 的 长 度 。“ 最 长 的 最 短 ” 可 能 听 起 
来 很 奇怪 : 要 确定 这 个 长 度 ， 我 们 找 出 所 有 市 感 对 之 间 的 最 短路 人 径 长 
度 ， 然 后 选择 其 中 最 长 的 。 


如 果 直 径 相对 网 络 中 节点 的 数量 较 小 ， 这 将 给 我 们 提供 找 出 小 世 
界 路 径 长 度 方面 所 需要 的 信息 。 但 其 实 这 对 于 我 们 这 里 的 目的 有 些 极 


端 : 当 我 们 想到 小 世界 时 ， 我 们 更 关心 的 是 最 短路 径 的 平均 值 〈 记 
住 ，6 是 图 14-2 中 的 中 位 数 ) 。 如 果 一 张 图 的 最 短路 径 长 度 刚 好 是 1、 
1、2、2、2、3、4、5， 和 那么 直径 是 5， 它 告诉 我 们 所 有 节点 对 中 的 最 
坏 情 况 ， 而 平均 数 (2.5) 或 中 位 数 (2) 能 对 小 世界 情况 进行 更 好 的 
总 结 。 你 可 能 还 记得 ， 我 们 在 第 10 章 使 用 所 谓 的 平均 最 短路 径 长 度 ， 
计算 接近 中 心性 指标 。 


图 14-4 
注 : 一 个 小 例 图 ， 用 来 计算 两 个 指标 : 平均 最 短路 径 距 离 和 聚集 系数 


让 我 们 找 出 图 14-4 中 小 型 网 络 的 这 个 长 度 是 多 少 。 第 一 步 是 找到 
所 有 的 最 短路 径 长 度 。 从 节点 A 开 始 ， 从 A 到 B 的 路 径 长 度 是 多 少 ? 有 
一 条 直接 的 链接 ， 最 短路 径 长 度 为 1。 从 A 到 C 呢 ? 同样 ， 最 短路 径 是 
一 条 直接 的 链接 。 对 于 A 到 D， 我 们 必须 经 过 路 径 (A，C，D) ， 其 长 
度 为 2。 从 A 到 E 呢 ? 它 经 过 路 径 (A，C，E) ， 其 长 度 也 为 2。 你 可 以 
按照 这 个 逻辑 ， 找 出 以 下 最 短路 径 的 长 度 : 从 B 到 C (1) ，B 到 D 

(2) ，B 到 E (2) ; 从 C 到 D (1) ，C 到 E (1) ; 从 D 到 E (1) 。 在 
这 10 对 节点 中 ， 平 均 最 短路 径 长 度 为 : 

a a a a i 志 

10 10 


1.4 


这 个 数字 说 明 什 么 ? 在 明智 地 选择 路 径 后 ， 一 个 人 可 以 通过 平均 
1.4 步 到 达 男 一 个 节点 。 这 个 例子 非常 直观 ， 因 为 图 中 只 有 5 个 节点 ， 
最 短路 径 的 长 度 为 1 或 2。 随 着 节点 数量 增长 ， 知 道 这 个 长 度 是 很 重要 
的 ， 其 价值 可 能 会 令 人 惊讶 。 


那么 ， 什 么 样 的 网 络 即使 有 很 多 节点 ， 其 平均 最 短路 径 长 度 也 会 
相对 较 小 ? 


随机 图 


想象 一 组 还 没有 链接 的 节点 。 然 后 有 人 一 个 接 一 个 地 经 过 每 个 市 
扩 对 ， 以 0 到 100% 之 间 的 某 个 固定 概率 在 它们 之 间 建 立 链接 。 直 观 地 
说 ， 这 个 概率 越 高 ， 你 就 会 看 到 更 多 链接 。 你 可 以 在 图 14-5 中 看 到 一 
些 结果 :在 左边 ， 链 接 建 立 的 概率 只 有 10%， 所 以 只 有 一 小 部 分 链接 
建立 。 随 着 它 在 右边 增加 到 50%， 更 多 链接 被 建立 ， 在 这 种 情况 下 ， 
大 约 一 半 的 节点 对 是 直接 连接 的 。 链 接 数 量 预计 将 和 概率 成 正比 。 


10% 25% 


图 14-5 
0 图 按照 一 定 概 率 在 两 个 节点 之 间 建 立 链接 。 随 着 这 一 概率 增加 ， 网 络 预计 将 有 更 多 
随机 图 (random graph) 就 是 这 样 建立 的 。 随 机 图 使 最 短路 
径 长 度 始终 很 小 ， 因 为 连接 网 络 两 端 节 点 的 远程 链接 是 可 能 的 ， 而 只 
要 几 条 远程 链接 ， 我 们 就 可 以 大 大 降低 最 短路 径 的 间距 。 然 而 ， 这 种 


网 络 形 成 过 程 昕 起 来 很 不 现实 。 它 就 好 比 找 一 堆 彼 此 不 认识 的 人 ， 把 
他 们 放 在 一 个 房间 里 ， 并 让 他 们 随机 决定 是 否 成 为 朋友 一 样 。 这 很 可 
能 不 会 发 生 ， 并 且 绝对 不 是 一 种 建立 联系 的 目 然 方式 。 


朋友 的 三 角形 


除了 较 小 的 平均 距离 ， 社 会 网 络 模型 需要 有 使 朋友 的 朋友 互相 成 
为 朋友 的 趋势 。 随 机 图 不 提供 这 一 趋势 ， 但 它 是 社会 网 络 的 一 个 重要 
特征 。 


怎么 衡量 这 个 特征 呢 ? 通过 使 用 所 谓 的 聚 类 系数 《clustering 
coefficient) 。 这 是 衡量 图 中 三 角 闭 合 数量 的 指标 ， 相 对 于 连接 三 
元 组 (connected triples) 总 数 ， 对 方 可 能 有 或 没有 完成 三 角形 的 
最 后 一 个 链接 。 


看 一 看 图 14-6。 连接 三 元 组 有 哪些? (A, B, C) 和 〈B，C， 
D) 都 是 ， 尽 管 后 者 没有 从 B 到 DD 的 直接 链接 。 (B，C，A) 和 (C， 
A，B) 也 是 。 把 A、B 和 C 的 三 个 连接 三 元 组 都 列 出 来 似乎 很 多 余 ， 但 
其 实 不 是 ， 因 为 每 一 条 都 是 通过 不 同 节 点 链接 的 不 同 路 径 。 (更 多 信 
息 请 参考 本 书 网 站 Q14.1 部 分 。) 这 些 节 点 之 间 有 三 条 链接 ， 这 使 ABC 
成 为 三 角 闭 合 ， 而 BCD 不 是 。 


图 14-6 


注 : 这 张 小 图 包含 一 个 三 角 闭 合 和 五 个 连接 三 元 组 ， 其 聚 类 系数 为 3/5 


图 中 的 三 角 闭 合 表示 彼此 认识 的 重合。 图 中 的 三 角 闭 合 越 多 ， 珍 
类 束 越 多 。 计 算 聚 类 系数 的 具体 公式 为 : 


3 x 三 角 闭 合 
链接 三 元 组 


乘 以 3 说 明 每 个 三 角 闭 合 有 三 个 连接 三 元 组 。 这 使 得 聚 类 系数 为 0 
(无 聚 类 ) 和 1 〈 完 全 聚 类 ) 之 间 的 一 个 数 。 


图 14-7 
注 : 此 图 中 除了 两 个 三 角 闭 合 〈 实 线 表示 ) ， 还 有 三 个 连接 三 元 组 (A, C, D) 、 (A, C, 


E) 、(B，C，D) ， 这 使 聚 类 系数 为 213 


图 14-6 中 的 聚 类 系数 是 多 少 ? 它 有 一 个 三 角形 和 五 个 连接 三 元 


因此 ， 图 中 当前 连接 表现 出 60% 的 聚 类 。 如 果 有 一 条 链接 从 B 到 
D， 系 数 将 增加 到 100% 。 


让 我 们 回 到 图 14-4。 ee 两 个 ，ABC 和 
CDE。 有 多 少 个 连接 三 元 组 ? 每 个 三 角形 已 经 有 三 个 。 此 外 ， 该 图 有 
三 个 连接 三 元 组 (A, C, D) 、 (A, C, E) 和 (B，C，E) ， 它 们 
都 不 在 三 角 闭 合 中 。 这 些 都 在 图 14-7 中 用 虚线 标 出 ， 并 表示 非 三 角形 
的 社会 联系 。 该 图 的 聚 类 系数 为 : 


随机 狗 的 聚 类 系数 往往 很 小 ， 这 了 束 是 为 什么 它们 不 能 解释 六 度 分 
隔 的 原因 。*“ 很 小 "是 多 小 ? 人 简单 说 ， 对 于 一 个 随机 图 ， 上 面 的 公式 大 
致 转化 为 ， 一 个 节点 的 平均 度数 除 以 网 络 中 的 节点 总 数 (请 记 住 ， 市 


点 的 度数 是 连接 到 它 的 链接 数 ) 。 选 择 2015 年 和 2016 年 脸 书 的 数字 ， 
这 个 图 中 将 有 16.5 亿 用 户 和 平均 每 人 350 个 朋友 。 如 果 脸 书 是 一 个 随机 
图 (其 实 不 是 ) ， 那 么 它 的 聚 类 系数 大 约 是 0.000 000 2。 这 对 于 现实 
中 的 社交 网 络 来 说 太 小 了 。 


正则 环 图 


可 以 解释 小 世界 的 图 像 模 型 应 该 有 两 个 主要 特征 ， 一 是 较 小 的 平 
均 最 短路 径 长 度 ， 二 是 较 大 的 聚 类 系数 。 


相 比 随机 模型 ， 如 有 果 我 们 考虑 另 一 个 极端 : 一 个 非常 规则 的 结 
构 ， 如 图 14-8 所 示 ， 情 况 会 怎样 ? 这 是 正则 环 图 (regular ring 
graph) 的 一 个 例子 ， 其 中 环 上 有 一 定数 量 的 节点 (此 图 中 有 8 个 ) 
的 结构 完全 由 两 个 数 决定 : 


2 链接 /节点 4 链接 /节点 
图 14-8 


注 ， 包 含 8 个 节点 的 正则 环 图 ， 每 个 节点 的 链接 数 不 同 。 随 着 每 个 节点 的 链接 数 增加 ， 聚 类 系 
数 也 会 迅速 增加 


， 环 上 的 市 点 数 ; 


* 每 个 斑点 拥有 的 链接 数 。 


两 者 都 是 偶数 ， 因 为 每 个 下 点 的 链接 都 是 均匀 分 布 的 : 一 半 回 一 
边 ， 男 一 半 向 男 一 边 。 当 每 个 条 点 有 两 个 链接 时 ， 图 就 变 成 一 个 纯 
环 ， 其 中 每 个 节点 只 连接 到 它 旁边 的 世 点 。 每 个 记 点 有 4 个 链接 时 ， 每 
个 连接 到 其 左边 的 两 个 近邻 以 及 右边 的 两 个 近邻 。 每 个 节点 有 6 个 链接 
时 如 何 ? 每 一 边 都 会 有 三 个 近邻 。 该 模式 将 以 这 种 方式 继续 。 


这 种 类 型 的 图 的 聚 类 系数 是 多 少 ? 对 于 每 个 节点 两 个 链接 ， 这 非 
常 简单 : 由 于 没有 三 角形 ， 所 以 聚 类 系数 为 0。 如 果 我 们 把 数字 增加 到 
4 会 怎么 样 ? 现在 ， 以 每 个 节点 为 中 心 有 一 个 三 角 闭 合 。 在 图 14-9 的 左 
上 方 ， 你 可 以 看 到 三 II 
了 于 三角 网 符 昌 的 全 下 每 不 有 是 有 三 个 三 元 组 必 其 为 让 必 计 于 节 忌 
C, (A, C, FE) 、(B, C, E) 和 C，D) 可 以 在 图 14-9 的 其 
他 部 分 看 到 。 


图 14-9 


注 ， 对 于 每 个 节点 有 四 个 链接 的 正则 环 图 ， 每 个 节点 将 有 一 个 三 角 闭 合 (左上 ) 和 另外 三 个 
连接 三 元 组 〈 另 三 张 图 片 ) 以 其 为 中 心 

目前 共有 一 个 三 角 闭 合 和 6 个 连接 三 元 组 。 我 们 需要 看 其 余 的 节点 
吗 ? 不 需要 。 因 为 正则 环 图 是 对 称 的 ， 所 以 每 个 节点 周围 的 结构 是 相 
同 的 。 例 如 ， 对 于 8 个 节点 ， 有 8 个 三 角 闭 合 和 6x8 = 48 个 连接 三 元 
组 ， 因 此 育 类 系数 为 : 


如 果 有 6 个 节点 呢 ? 还 是 3x67/36 = 1/2。 如 果 有 100 个 呢 ? 3x100 7 


600 = 1/2， 还 是 一 样 。 正 则 环 图 的 聚 类 系数 不 取决 于 节点 数量 ， 因 为 
每 个 额外 的 节点 都 会 添加 等 量 的 三 角 闭 合 和 连接 二 元 组 。 


从 每 个 忆 点 两 个 链接 的 0 聚 类 到 每 个 节点 4 个 链接 的 50% 聚 类 ， 这 
是 相当 巨大 的 增长 。 随 着 更 多 的 链接 被 添加 进来 ， 增 长 会 放 缓 ， 但 仍 
会 继续 增长 。 你 可 以 在 图 14-10 中 看 到 这 个 趋势 “如果 你 对 具体 方程 感 
兴趣 ， 请 参考 本 书 网 站 Q14.2 部 分 ) : 随 着 每 个 节点 的 链接 数量 变 得 非 
钟 大 ， 聚 类 系数 接近 正则 环 拓扑 的 最 大 值 344， 或 0.75。759% 聚 类 很 好 
也 很 大 ， 或 者 也 许 太 大 了 。 
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0 246 8 10121416 1820222426283032343638404244464850 
每 个 节点 的 链接 
图 14-10 
注 : 正则 环 图 中 的 聚 类 系数 取决 于 每 个 节点 的 链接 数 。 当 链接 数 变 得 非常 大 时 ， 系 数 接近 


正则 环 图 模型 与 随机 图 模型 形成 了 鲜明 对 比 。 与 随机 图 不 同 的 
是 ， 它 的 聚 类 系数 较 高 ， 这 对 于 社会 网 络 是 很 现实 的 。 然 而 ， 由 于 每 
个 刷 点 只 连接 到 它 的 最 近邻 ， 因 此 只 存在 短 距离 连 接 ， 这 使 得 正则 图 


有 较 大 的 平均 最 短路 径 长 度 。 要 到 达 网 络 另 一 端的 节点 ， 必 须 穿 过 几 
条 短 链接 ， 如 图 14-11 所 示 。 


图 14-11 
注 : 没有 远程 连接 ， 正 则 环 图 将 有 较 小 的 平均 最 短路 径 长 度 。 此 图 中 有 16 个 节点 ， 每 个 节点 


有 4 条 链接 ， 需 要 4 条 链接 通过 节点 A 和 B 之 间 


如 果 我 们 不 断 增加 每 个 节点 的 链接 数量 ， 那 么 就 不 会 在 人 与 人 之 
间 建 立 更 直接 的 连接 ， 从 而 使 路 径 更 短 吗 ? 这 在 理论 上 是 可 行 的 ,但 
也 是 不 现实 的 ， 因 为 逐渐 缩小 平均 长 度 会 要 求 每 个 人 都 与 人 口中 越 来 
越 多 的 部 分 联系 在 一 起 。 这 在 现实 生活 中 显然 是 不 正确 的 ， 因 为 每 个 
人 都 只 是 总 人 口中 一 小 部 分 人 的 “好 友 ”。 


图 14-12 概 括 了 正则 环 图 和 随机 图 的 差异 。 古 否 有 可 能 得 到 一 个 混 
合 图 ， 既 能 结合 这 两 种 类 型 的 属性 ， 又 能 包含 两 个 世界 最 好 的 部 分 
一 一 较 大 的 聚 类 系数 和 较 小 的 平均 最 短 距 离 ” 如 有 果 我 们 能 做 到 这 一 
点 ， 也 许 能 够 解释 为 什么 “六 度 ” 会 出 现 。 


随机 图 


正则 环 图 


较 小 平均 最 短 距离 mn 


较 小 聚 类 系数 “和 


注 : 正则 环 


鲁 模型 和 随机 


较 大 平均 最 短 距离 局 


绞 大 来 类 系数 。“@p| 


图 14-12 


辐 模型 的 3 


均 最 短路 径 长 度 和 聚 类 系数 形成 鲜明 对 比 


正则 加 上 随机 : 沃 茨 -斯 托 加 茨 模型 


让 我 们 考虑 一 下 实际 情况 。 一 方面 ， 我 们 需要 较 大 的 聚 类 系数 。 
正则 图 正好 提供 。 男 一 方面 ， 我 们 需要 一 些 远 程 链 接 来 减少 图 的 两 站 
之 则 的 距离 。 那 么 ， 如 末 我 们 在 相反 的 市 挟 之 间 添 加 几 个 链接 呢 ? 


这 是 沃 艾 -斯 托 加 获 模 型 (Watts-Strogatz model) 背后 的 基 
本 思想 ， 它 由 邓肯 : 沃 深 和 史 带 分 :斯 托 加 次 于 1998 年 在 《上 自然 》 杂 志 上 
发 表 的 论文 中 首先 提出 。 该 模型 对 拥有 较 大 聚 类 系数 的 小 世界 网 络 进 
行 了 非常 直观 的 解释 。 


沃 茨 -斯 托 加 茨 图 看 起 来 像 图 14-13。 要 建立 该 模型 ， 我 们 需要 先 
建立 一 个 正则 环 ， 其 中 每 个 市 点 都 有 合理 的 链接 数 ， 然 后 在 节操 之 间 
随机 添加 一 些 远 程 链 接 。 这 些 随 机 链接 通过 在 正则 环 图 中 穿 过 每 一 个 
链接 ， 并 且 在 一 些 随机 节点 对 之 间 按 照 一 定 概率 建立 链接 而 产生 。 


图 14-13 
注 : 沃 菩 - 斯 托 加 欧 模 型 在 正则 环 图 中 添加 随机 链接 ， 或 者 是 远 距 离 链接 。 每 当 有 短 距 离 链 接 


存在 时 ， 就 有 机 会 建立 远 距离 链接 ， 来 随机 连接 两 个 节点 


关键 是 ， 只 要 “一 点 把 ”这 些 额 外 的 链接 ， 我 们 整 可 以 保持 较 大 的 
正则 环 图 案 类 系数 ， 同 时 实现 小 世界 效应 。 少 量 随机 化 操作 可 以 大 大 
减少 平均 最 短路 人 径 距离 。 当 然 ， 随 机 加 入 远 距离 链接 会 降低 诊 类 系 
数 ， 因 为 它 会 增加 连接 三 元 组 的 数量 ， 并 很 可 能 不 会 创建 更 多 的 三 角 
闭合 。 


我 们 需要 多 少 随 机 化 操作 来 减少 距离 ， 以 及 在 仍然 保持 聚 类 系数 
的 同时 ， 我 们 可 以 容忍 多 少 ? 事实 证 明 ， 只 要 链接 建立 的 概率 很 小 
(例如 约 10%) ， 对 聚 类 系数 的 影响 将 几乎 可 以 忽略 不 计 ， 但 平均 最 
生路 径 距离 将 急剧 减少 。 你 可 以 在 图 14-14 中 看 到 这 种 行为 ， 其 中 我 们 
对 于 不 同 链接 建 立 的 概率 ， 多 次 建立 沃 深 - 斯 托 加 欧 模 型 (总 共 包 含 
600 个 证 点 ， 每 个 入 点 有 6 个 链接 ) ， 并 绘制 聚 类 系数 和 平均 最 短路 径 
长 度 的 最 终 变化 情况 ( 除 以 其 最 大 值 ， 将 纵 轴 限制 在 O 和 100% 之 间 ， 
以 进行 赋 范 比较 ) 。 当 概率 在 1%~10% 的 范围 内 时 ， 距 离 较 小 ， 系 数 
较 大 ， 这 是 现实 中 的 小 世界 图 所 需要 的 。 

100 . 

90 

80 

70 

60 


较 大 聚 类 系数 
较 小 平均 最 短 距 离 


百分比 
(An 
= 


0.1 1 本 10 100 
链接 概率 ( % ) 


图 14-14 

注 : 当 沃 次 -斯 托 加 次 图 中 建立 链接 的 概率 很 小 (例如 1%~10%) ， 聚 类 系数 几乎 没有 下 降 ， 
但 平均 最 短 距离 则 会 大 幅 减少 。 该 模型 就 是 这 样 产 生 具 有 较 大 聚 类 系数 的 小 世界 

为 什么 随机 建立 链接 会 使 平均 最 短 距 离 大 幅 减 少 ， 但 又 不 太 影 啊 
聚 类 系数 ? 本 质 在 于 我 们 对 度量 标准 的 定义 。 一 方面 ， 最 短路 径 是 极 
值 测度 : 我 们 只 关心 两 个 节点 之 间 的 最 短 距 离 ， 所 以 不 需要 减少 所 有 
路 径 的 长 度 。 我 们 只 需要 添加 一 些 远 程 链 接 ， 即 使 随机 添加 ， 最 短路 
径 也 将 大 大 缩小 。 另 一 方面 ， 聚 类 系数 是 平均 值 : 它 由 三 角形 总 数 除 


以 图 中 的 连接 三 元 组 总 数 得 出 ， 加 入 一 小 部 分 非 三 角形 连接 三 元 组 并 
不 真正 影响 保 类 系数 。 


这 束 是 有 较 大 聚 类 系数 的 小 世界 的 神奇 之 处 : 我 们 与 大 多 数 朋 友 
有 三 角 闭 合 的 关系 ， 但 还 有 很 小 一 部 分 朋友 在 我 们 的 正 利 社交 阁 之 
外 。 米 尔格 拉 姆 当初 需要 用 来 分 析 六 度 分 隔 的 ， 就 是 这 很 小 一 部 分 的 


远程 链接 。 


在 了 解 小 世界 的 结构 方面 之 后 ， 我 们 现在 转向 该 现象 的 第 二 个 ， 
也 十 更 令 人 惊讶 的 部 分 ， 人 们 如 何 能 够 发 现 最 短路 人 径 。 


更 重要 的 : 六 个 步 又 甚至 能 在 局 部 发 现 


我 们 不 禁 要 问 ， 为 什么 最 短路 径 是 用 极 值 进行 衡量 的 ， 而 聚 类 系 
数 是 以 平均 值 来 衡量 ? 相 比 于 找到 所 有 节点 之 间 的 最 短路 径 ， 我 们 不 
应 该 还 要 找到 平均 路 径 长 度 吗 ? 人 们 普遍 认为 没 必要 平均 。 对 于 图 中 
的 任意 两 个 丰 点 ， 只 要 存在 一 条 短路 径 束 足够 了 ， 因 为 节点 可 以 使 用 
此 路 径 进行 通信 。 如 有 条 其 他 路 径 不 会 被 使 用 ， 束 没有 理由 保证 所 有 路 
径 都 是 短 的 。 


但 我 们 必须 确保 人 们 能 真正 找到 这 样 一 条 路 径 。 这 个 社会 搜索 的 
过 程 并 不 总 是 容易 的 : 人 们 不 知道 网 络 结构 ， 所 以 如 果 他 们 没有 直接 
连接 到 其 目的 地 ， 那 么 就 很 难 确定 下 一 步 该 去 哪里 。 你 可 以 在 图 14-15 
中 看 到 一 个 例子 如果 A 和 C 要 从 网 络 的 两 端 进行 交流 ， 它 们 怎么 会 知 
道 ， 它 们 有 一 个 可 以 通过 的 共同 近邻 B? 


图 14-15 


注 ， 在 此 沃 获 - 斯 托 加 欧 图 中 ， 有 几 条 远程 链接 。 从 A 到 C 存 在 一 条 短路 径 (A，B，C) 。 但 A 
如 何 知道 这 条 短路 径 是 什么 ， 或 者 它 是 否 存在 呢 

正如 我 们 在 第 12 章 互联 网 部 分 看 到 的 ， 被 称 为 路 由 卓 的 设备 基于 
其 局 部 视图 ， 向 彼此 传递 信息 ， 使 其 能 够 找到 向 哪里 发 送信 息 ， 将 其 
放 在 最 短路 径 中 。 这 种 类 型 的 路 由 不 会 发 生 在 社交 网 络 中。 所 以 问题 
依然 存在 : 在 米尔 格拉 姆 式 的 实 对 中 ， 人 们 如 何 能 够 找到 最 短路 径 
呢 ? 


仙 禁 社会 搜索 


如 条 你 是 那些 参与 米尔 格拉 姆 实验 的 人 之 一 ， 或 者 是 这 些 人 开辟 
的 路 径 上 的 人 之 一 ， 你 会 如 何 仅 赁 收 信人 的 姓名 、 地 址 和 职业 ， 束 决 
定 最 佳 的 下 一 跳 ? 你 可 能 会 考虑 到 地 理 距 离 (比较 容易 看 到 ) 和 职业 
距离 (比较 难 确定 ) 的 某 些 组 合 ， 想 出 一 个 “社会 距离 ”。 然 后 你 会 看 


看 你 知道 名 字 的 朋友 们 ， 并 基于 此 距离 ， 挑 一 个 特点 最 接近 收 信人 的 
朋友 。 


这 是 仿 禁 社会 搜索 (greedy social search) 的 理念 ， 即 人 们 
会 根据 其 本 地 信息 做 出 发 送信 息 的 最 好 决定 。 所 以 如 果 市 点 A 要 到 节 
点 Z， 他 会 看 看 所 有 的 近邻 ， 并 确定 发 送 给 谁 最 合适 。 然 后 ， 下 个 节 
点 (如 B) 会 看 看 Z 的 特点 ， 确 定 发 送 给 谁 。 然 后 下 个 节点 (如 C) 会 
采取 同样 行为 ， 直 到 消息 最 后 到 达 Z。 当 然 ， 这 种 方法 并 不 总 是 会 发 
现 最 佳 的 路 由 ， 因 为 没 人 有 网 络 的 全 局 视图 ， 但 它 往 往 是 够 用 的 。 你 
可 以 在 图 14-16 中 看 到 它 的 一 个 例子 ， 其 中 凯特 经 过 路 径 〈K，A， 
B，S) 到 达 苏 珊 ， 但 最 短路 径 实际 上 是 (K，C，S) 。 凯 特 运行 贪 梦 
搜索 来 确定 ， 相 比 于 她 的 其 他 任何 近邻 ， 在 加 州 由 洛 阿 尔 托 的 政治 家 
爱丽 丝 更 “接近 ”在 华盛顿 州 西雅图 的 一 位 律师 。 然 后 爱丽 丝 转发 给 旧 
金山 的 政治 家 鲍 劲 ， 对 方 恰 好 认识 苏 珊 。 事 实 上 ， 磁 巧 她 在 新 泽 西 州 
萨 米 特 的 一 位 精算 师 朋 友 查 理 与 苏 珊 有 直接 联系 。 


在 这 个 贷 梦 搜索 过 程 中 发 现 的 平均 长 度 接近 平均 最 短路 径 长 度 
吗 ? 我 们 希望 如 此 ， 如 图 14-16 所 示 的 情况 (2 不 比 3 小 很 多 ) 。 如 果 是 
这 样 ， 那 么 我 们 可 以 说 ， 短 路 径 除 了 是 合理 的 ， 还 是 可 以 发 现 的 。 在 
过 去 15 年 里 ， 除 了 最 初 的 沃 次 -斯 托 加 次 模型 ， 多 个 社会 搜索 模型 都 对 
这 个 问题 给 出 肯定 回答 。 如 果 你 对 此 感 兴趣 ， 请 参考 本 书 网 站 Q14.3 部 


sw 华盛顿 州 
en 
政治 家 D 


图 14-16 


注 : 如果 没 有 网 络 的 全 局 视图 ， 每 个 人 都 可 能 进行 信 禁 社会 搜索 ， 以 确定 一 条 到 目的 地 的 路 
。 这 种 策略 并 不 总 会 发 现 最 佳 的 路 由 ， 但 希望 是 ， 所 发 现 的 路 径 长 度 至 少 会 接近 最 短 的 长 


二 


总 之 ， 事 实证 明 ， 通 过 六 个 或 更 少 步 又 连接 我 们 的 世界 是 合理 
。 通过 分 布 式 人 体 路 由 ， 可 以 从 网 络 的 一 端 到 另 一 端 发 现 这 些 步 


[© 


终端 主机 智能 是 出 现在 各 种 网 络 应 用 中 的 一 个 重要 原则 。 互 联 
网 经 常 遵循 端 到 端的 设计 ， 让 终端 主机 负责 建立 、 维 护 和 控制 会 
话 ， 而 网 络 本 身 只 负责 逐 跳 传输 数据 包 。 在 本 书 的 最 后 一 部 分 ， 我 
们 首先 研究 了 每 台 传输 设备 的 传输 层 如 何 控制 互联 网 上 的 拥塞 使 
用 由 接收 端 提供 的 反馈 消息 来 推断 网 络 条 件 和 调节 对 链接 容量 的 需 
求 。 然 后 我 们 了 解 到 ， 由 于 人 们 仅 赁 本 地 信息 就 能 发 现 到 达 网 络 另 
一 端的 其 他 人 的 短路 径 ， 因 此 这 样 大 而 不 断 增 长 的 网 络 仍然 是 小 世 
界 。 

本 书 主要 叙 壕 了 网 络 六 条 原则 一 “分 享 很 难 、 排 序 很 难 、 大 众 
很 聪明 、 大 众 并 不 那么 聪明 、 分 而 治之 以 及 端 到 端 。 在 这 六 个 部 分 
中 ， 我 们 看 到 了 很 多 不 同 的 网 络 ， 并 探讨 如 何 将 它们 表示 为 图 形 


(例如 网 页 、 设 备 或 路 由 器 ) 以 及 这 些 图 形 之 上 的 功能 (例如 网 页 
级 别 、 分 布 式 功率 控制 、 路 由 ) 。 


虽然 本 书 至 此 已 经 接近 尾声 ， 但 我 们 希望 你 的 思维 旅程 将 继 
续 。 你 将 继续 在 生活 中 遇 到 我 们 在 本 书 中 没有 讨论 过 的 网 络 ， 其 中 
许多 可 能 还 没有 发 明 。 当 你 遇 到 它们 的 时 候 ， 我 们 希望 你 能 思考 ， 
这 六 条 原则 中 的 哪 一 条 可 能 适用 于 这 种 情况 。 

同样 重要 的 是 ， 我 们 希望 你 能 牢记 这 些 原则 中 反复 出 现 的 主 
题 。 你 也 可 以 考虑 其 中 哪些 在 日 常生 活 中 出 现 。 这 里 是 对 从 过 去 14 
章 中 选 出 的 六 个 主题 的 简短 回顾 ; 


。 负 反馈 发 生 时 ， 网 络 使 用 有 关 其 当前 状况 的 信号 ， 使 其 状态 达 
到 平衡 。 该 主题 多 次 出 现 ， 从 第 1 章 蜂 帘 功 率 控制 ， 到 第 3 章 数 据 定 
价 ， 再 到 第 13 章 互联 网 拥塞 控制 。 

。 正 反馈 与 其 相反 ， 网 络 利 用 正 反 馈 放 大 其 效果 ， 一 般 会 远离 平 
衡 o 

。 分 布 式 协 调 在 网 络 中 较 小 的 实体 之 间 分 散 任务 责任 。 即 使 每 一 
个 实体 只 有 网 络 的 本 地 视图 ， 全 局 合作 还 是 有 可 能 出 现 。 这 个 主题 
也 多 次 出 现 ， 从 第 2 章 Wi_Fi 随 机 访问 到 第 12 章 互联 网 转发 。 

。 积极 的 网 络 效应 出 现时 ， 更 多 人 加 入 网 络 往 往 有 利于 所 有 人 ， 
如 第 9 章 中 提 到 的 例子 和 第 6 章 的 产品 评级 。 


“ 消极 的 网 络 效 应 与 其 相反 ， 更 多 人 加 入 网 络 往 往 会 减损 所 有 人 
的 利益 ， 如 第 3 章 统一 费 率 的 “悲剧 ”。 


* 意见 汇总 在 人 们 的 意见 公正 并 彼此 独立 时 ， 可 以 表现 得 很 好 ， 
如 我 们 在 第 6 章 看 到 的 情况 。 因 此 ， 当 平均 评级 基于 更 多 意见 时 ， 我 
们 更 倾向 于 信任 平均 产品 和 电影 评级 。 


如 果 这 些 主题 留 在 了 你 的 脑海 里 ， 那 么 通过 阅读 本 书 ， 你 已 经 
了 解 到 很 多 关于 网 络 的 力量 的 知识 ! 


与 温 顿 .功夫 的 对 话 


温 顿 . 瑟 夫 被 公认 为 “互联 网 之 父 ”。 他 与 鲍 动 : 卡 恩 共同 发 明了 
TCP/IP 。 


作者 : 温 顿 ，1974 年 前 后 ， 你 和 同事 一 起 架构 TCP/IP 协 议 时 ， 做 
出 的 最 重要 的 决定 是 什么 ? 


多 顿 : 我 认为 最 重要 的 决定 可 能 是 引入 全 球 寻 址 结构 ， 我 们 称 之 
为 网 络 协议 和 网 络 地 址 。 当 时 ， 我 们 已 经 预见 到 ， 有 多 个 网 络 是 互联 
网 形成 的 网 络 之 网 络 的 一 部 分 。 我 们 还 知道 ， 大 多 数 网 络 ， 也 许 所 有 
网 络 ， 都 没有 存在 任何 其 他 网 络 的 概念 。 每 个 网 络 都 认为 目 己 是 世界 
上 唯一 的 网 络 。 所 以 ， 在 一 个 特定 的 网 络 上 ， 没 有 办 法 说 “请 发 送 到 另 
一 个 网 络 ”。 鲍 勃 ' 卡 恩 和 我 在 进行 设计 时 ， 很 快意 识 到 我 们 需要 一 个 
方法 来 表达 “把 这 个 发 送 到 一 个 不 是 你 的 网 络 上 ， 以 使 这 个 网 络 之 网 络 
形成 ”。 


第 二 个 决定 不 是 技术 性 的 。 这 是 一 个 方针 决策 : 我 们 当时 是 否 应 
该 在 不 确定 有 多 少 细 季 ， 没 有 任何 限制 ， 也 没有 任何 专利 设计 或 知识 
产权 的 限制 时 公布 这 项 设计 。 


我 们 真 的 考虑 了 这 个 问题 ， 还 记得 我 们 当时 在 为 国防 部 做 这 项 工 
人 


国防 部 的 问题 是 ， 建 立 网 络 唯一 方便 的 方法 是 连接 类 似 品 牌 的 机 
顷 。IBM 拥 有 把 其 机 器 连接 在 一 起 的 系统 网 络 架 构 ， 数 字 设 备 公司 有 
一 种 可 以 将 其 机 器 相连 的 DEC 网 络 系统 ， 惠 普 有 一 种 叫 DS 的 系统 ， 
想 它 表示 分 布 式 系统 ， 同 样 ， 它 只 连接 惠普 的 机 器 。 我 们 认为 ， 国 防 


部 不 必 购买 某 种 特定 品牌 的 机 器 ， 就 能 实现 网 络 效应 。 所 以 这 是 第 一 
点 ， 意 味 着 我 们 需要 进行 一 个 非 专 有 的 设计 。 


互联 网 的 前 身 叫 作 阿 帕 网 ， 全 称 为 “高 级 研究 计划 署 网 络 *”。 该 网 
络 是 使 用 专用 电话 线路 将 分 组 交换 机 彼此 连接 而 建立 的 。 这 是 一 个 均 
们 、 同 质 的 网 络 ， 由 美国 各 个 机 构 非 常 不 同 的 计算 机 连接 到 上 面 。 这 
是 一 个 专用 电话 电路 和 分 组 交换 机 的 同 质 网 络 。 


当 我 们 意识 到 必须 应 对 所 有 这 些 其 他 的 平台 时 ， 我 们 就 开始 开发 
移动 无 线 网 络 和 卫星 网 络 ， 以 应 对 移动 车 辆 、 海 上 船舶 和 飞机 通信 的 
情况 。 但 是 这 样 做 以 后 ， 我 们 意识 到 ， 这 些 不 同 的 分 组 交换 网 络 有 不 
同 的 特点 ， 我 们 必须 找到 一 种 方式 把 它们 连接 在 一 起 ， 使 任何 特定 网 
络 中 的 电脑 不 需要 知道 ， 有 多 少 其 他 网 络 也 是 系统 的 一 部 分 ， 或 流量 
征 被 如 何 路 由 的 。 我 们 只 是 硕 望 ， 它 能 够 像 消费 者 把 一 张 明 信和 片 放 进 
邮箱 一 样 ， 并 期 竺 邮政 服务 会 负责 找到 它 该 去 的 地 方 ， 它 应 该 如 何 到 
达 那 里 ， 以 及 什么 时 候 应 该 送 达 。 因 此 ， 在 全 球 运行 的 意义 上 ， 我 们 
模仿 邮政 服务 。 邮 政 服务 使 用 一 种 寻 址 格式 ， 将 信息 从 一 个 国家 传递 
到 男 一 个 国家 。 


这 些 可 能 是 最 重要 的 决定 : 公开 发 布 ， 并 消除 任何 影响 采用 的 障 
碍 。 我 们 决定 不 对 设计 的 使 用 施加 任何 知识 产权 限制 ， 免 费 公 布 了 所 
有 文件 。 随 着 互联 网 的 发 展 ， 后 来 创建 的 机 构 同样 对 其 出 版 物 和 技术 
规范 非常 开放 ，40 年 后 的 今天 同样 如 此 。 


作者 : 这 真是 个 有 趣 的 故事 ， 温 顿 ， 也 是 非常 重要 的 决定 ， 直 到 
现在 都 影响 着 我 们 的 生活 和 工作 方式 。 同 样 有 趣 的 是 ， 你 提 到 了 这 些 
地 址 ， 我 想 继续 这 个 话题 。 其 中 的 一 个 系统 是 IPv6， 它 是 一 个 更 大 的 
地 址 空间 。 回 IPv6 转 换 的 进展 如 何 ? 


多 顿 : 这 是 个 好 问题 。 让 我 们 回顾 一 下 ， 我 们 经 历 了 互联 网 设计 
的 多 次 迭代 ， 确 切 说 是 四 次 。 原 设计 有 一 个 协议 一 一 传输 控制 协议 ， 


它 通 过 多 个 网 络 管理 从 源 主机 到 目的 主机 的 流量 。 在 设计 、 实 施 和 测 
试 的 欠 代 过 程 中 ， 我 们 意识 到 ， 实 时 通信 可 能 是 非常 重要 的 。 语 音 、 
视频 和 雷达 并 不 一 定 要 求 100% 保 证 数据 传输 ， 尤 其 是 考虑 到 这 些 数据 
会 动态 更 新 ， 特 别 是 在 雷达 跟 路 的 情况 下 。 


你 想 要 的 是 低 延 迟 ， 于 是 你 得 到 交互 式 低 延迟 交换 。 如 采 有 人 因 
为 数据 包 丢 失 而 没有 收 到 消息 ， 束 会 要 求 对 方 重复 一 授 。 于 是 ， 当 你 
听 到 杂音 ， 没 有 听 到 对 方 说 什么 ， 你 会 说 :“ 什 么 ? 请 重复 一 裔 。” 


同样 的 做 法 对 视频 也 成 立 。 你 可 能 会 遇 到 故障 ， 有 一 帧 的 一 部 分 
没有 显示 出 来 。 但 是 另 一 巅 马 上 会 来 ， 所 以 不 必 担 心 重 发 前 一 帆 ， 
为 用 户 不 想 看 到 。 如果 你 尝试 这 样 做 (重新 发 送 ) ， 就 会 增加 双方 之 
间 的 延迟 。 如 采 他 们 正 试 图 进行 视频 电话 会 议 ， 那 么 会 议 最 终 将 无 法 
继续 ， 因 为 延迟 在 逐渐 增加 。 


所 以 ， 比 起 让 延迟 增加 ， 我 们 说 ， 让 我 们 允许 数据 包 丢 失 ， 但 要 
注意 延迟 。 讨 论 的 结果 是 将 互联 网 协议 (IP) 和 传输 控制 协议 
(TCP) 分 开 ， 使 其 成 为 系统 中 的 一 个 独特 的 层 ， 不 要 求 进行 序列 可 
靠 传 输 。 所 以 ，TCP 负 责 数据 的 序列 可 靠 传 输 ， 而 耳 只 负责 将 数据 包 
传递 到 可 能 并 不 可 靠 的 目的 地 。 这 个 决定 钙 TCP 设 计 第 三 次 迭代 前 后 
做 出 的 。 


第 二 个 问题 我 们 很 早 束 在 思考 :“ 我 们 应 该 预计 这 个 互联 网 有 多 少 
个 终止 点 ? ”我 们 当时 真 的 不 知道 答案 。 所 以 我 们 的 第 一 个 问题 是 “让 
我 们 看 看 ， 每 个 国家 会 有 多 少 网 络 ? "我 们 想 ， 也 许 每 个 国家 都 会 有 两 
个 国家 级 的 网 络 ， 所 以 会 有 一 些 竞 争 。 然 后 我 们 说 : “有 多 少 个 国家 
呢 ? ?我们 不 知道 答案 ， 当 时 也 没有 谷歌 ， 于 是 我 们 猜测 有 128 个 ， 
为 这 是 2 的 乘 方 ， 程 序 员 吏 是 这 样 思考 的 。 


所 以 我 们 说 : “好 吧 ， 我 们 需要 8 比特 的 信息 来 识别 世界 上 的 256 个 
网 络 。” 然 后 我 们 问 ， 有 和 多少 计算 机 将 连接 到 每 个 网 络 。 我 们 同样 不 知 


道 答案 。 但 是 我 们 说 ， 我 们 应 该 大 方 些 。 于 是 我 们 猜 每 个 网 络 有 1 600 
万 台电 脑 ， 考 虑 到 计算 机 人 花费 数 百 万 类 元 ， 在 非常 大 并 狐 有 空调 的 房 
间 里 运行 ， 这 在 当时 是 非常 惊人 的 。 


所 以 你 可 以 用 24 比 特 的 信息 来 表示 这 么 多 数量 的 机 器 。 我 们 最 终 
为 IPv4 选 择 32 位 地 址 空间 。 它 在 互联 网 上 提供 的 终止 点 总 数 是 43 亿 。 
我 必须 说 ， 在 1973 年 ， 对 于 互联 网 上 可 能 出 现 的 计算 机 数量 ， 这 似乎 
征 一 个 非常 大 的 数字 。 


于 是 我 们 沿 着 这 条 路 走 下 去 。 但 是 ，1973 年 ， 吏 是 鲍 莹 和 我 进行 
这 项 工作 的 同一 年 ， 施 乐 帕克 人 研究 中 心 发 明了 以 太 网 。 这 古 一 小 块 同 
轴 电 纺 和 一 些 设备 ， 能 将 当时 的 笔记 本 电脑 或 台式 电脑 以 非常 高 的 速 
度 共 同 接 入 广播 网 络 ， 当 时 速度 为 每 秒 3Mb， 这 似乎 很 大 。 大 约 在 
1980 年 或 1981 年 后 ， 以 太 网 技术 作为 商业 产品 被 迅速 推广 开 来 。 这 些 
网 络 迅速 填 补 了 互联 网 上 大 量 的 地 址 空间 。 其 结果 是 ， 到 20 世 纪 90 年 
代 初 ， 初 始 地 址 空间 明显 不 足以 满足 需求 。 


关于 还 需要 多 少 地 址 空间 ， 人 们 有 很 多 争论 。 我 们 认为 32 位 地 址 
空间 不 够 ， 那 么 应 该 增加 到 128 位 ， 还 是 应 该 选择 电话 号 码 采 取 的 可 变 
长 度 的 寻 址 形式 。 没 有 选择 可 变 长 度 是 有 原因 的 。 于 是 ， 我 们 最 终 选 
择 128 位 ， 并 称 其 为 互联 网 协议 ITPv6 版 本 。 


到 2015 年 的 这 个 阶段 ， 我 们 进行 这 次 对 话 时 ， 第 4 版 (IPv4) 网 络 
地 址 空间 已 基本 耗 尽 。 当 时 ， 已 经 没有 可 用 的 地 址 空间 。 这 样 说 似乎 
有 些 夸 张 ， 因 为 一 些 负责 分 配 互联 网 地 址 空间 的 机 构 ， 所 谓 的 区 域 互 
联网 注册 管理 机 构 ， 仍 然 有 一 定数 量 的 地 址 ， 但 不 多 。 大 多 数 地 址 已 
经 用 完了 ， 没 有 可 用 的 第 4 版 地 址 空间 。 


因此 ，20 世 纪 90 年 代 初 之 后 ， 我 们 意识 到 我 们 将 陷入 困境 ， 于 是 
在 1996 年 前 后 开始 将 IPv6 标 准 化 。 我 们 错误 地 认为 ， 所 有 人 都 会 意识 
到 快速 实施 IPv6 的 重要 性 ， 这 样 我 们 就 不 会 因为 IPv4 的 限制 而 受到 制 


约 ， 但 这 并 没有 发 生 。 当 时 人 们 还 没有 用 完 地 址 空间 ， 最 近 才 用 完 
(在 大 约 2011 年 ) 。 所 以 ， 与 IPv4 同 时 实施 IPv6 的 步伐 很 慢 。 现 在 我 
们 开始 看 到 它 加 速 ， 是 因为 第 4 版 地 址 基本 上 已 经 消耗 光 了 。 


因此 ， 与 IPv4 并 行 实施 IPv6 的 步伐 加 快 。 我 们 必须 同时 运行 两 个 
协议 ， 以 迎合 运行 v4 的 旧 群 体 和 运行 v6 的 新 群体 。 我 们 必须 同时 运行 
两 个 协议 ， 因 为 它们 不 能 相互 作用 ， 因 为 你 不 能 把 128 位 的 地 址 放 进 32 


位 的 空间 。 


作者 : 谢谢 你 让 我 们 了 解 迭 代 的 历程 。 它 显示 了 很 多 非常 有 趣 的 
架构 决定 ， 比 如 层 的 分 裂 。 你 提 到 TCP/AP 受 到 延迟 和 差错 恢复 权衡 的 
驱动 ， 也 讲述 了 过 去 几 十 年 互联 网 如 何 扩展 的 有 趣 故 事 。 如 今 ， 信 息 
物理 系统 和 智能 城市 兴起 ， 其 中 有 的 物理 控制 系统 需要 非常 小 和 几乎 
不 可 抗拒 的 延迟 。 你 认为 这 些 网 络 边缘 或 有 时 在 人 体内 出 现 的 信息 物 
理 系统 ， 也 将 迫使 我 们 重新 审视 延迟 问题 吗 ? 


湿 顿 ， 这 是 一 个 有 趣 的 问题 。 我 想 答案 可 能 是 ， 因 为 有 些 情况 下 
的 延迟 得 到 很 好 的 控制 ， 因 为 你 处 理 的 网 络 组 件 距离 很 近 。 我 们 必须 
考虑 的 是 ， 光 速 延 迟 不 会 消失 。 因 此 ， 无 论 你 如 何 处 理 协 议 ， 都 可 能 
有 由 距离 造成 的 不 可 减 小 的 最 小 延迟 。 


解决 这 个 问题 的 方法 ， 当 然 是 设计 和 建立 使 用 附近 而 不 是 远程 网 
络 的 系统 。 当 你 有 像 蓝 牙 甚 至 Wi-Fi 之 类 的 功能 时 ， 通 常情 况 下 ， 相 互 
作用 是 局 部 的 ， 因 此 延迟 非常 低 。 所 以 这 种 情况 下 ， 你 不 会 有 问题 。 


另 一 方面 ， 某 些 应 用 程序 可 以 被 设计 为 对 延迟 不 敏感 ， 在 这 种 情 
况 下 ， 它 们 可 以 在 几乎 任何 地 方 运行 。 我 看 到 这 两 个 角度 都 存在 于 应 
用 程序 空间 中 ， 其 中 一 些 应 用 程序 对 延迟 足够 的 不 敏感 ， 电 子 邮件 就 
是 一 个 很 好 的 例子 。 但 正如 你 所 说 的 ， 对 于 某 些 信息 物理 系统 (有 时 
称 为 物 联网 ) ， 你 需要 低 延 迟 ， 使 应 用 程序 工作 。 


作者 : 我 们 在 这 次 对 话 中 也 提 到 过 ， 有 时 “ 云 "需要 降 到 地 面 并 成 
为 “ 筋 ”"， 以 确保 某 些 应 用 程序 的 延迟 非常 小 。 如 今 ， 我 们 在 电视 广告 
上 看 到 不 同 公司 谈论 物 联网 将 如 何 改变 我 们 的 生活 和 工作 方式 ， 以 及 
工厂 和 农业 将 如 何 运行 。 你 还 看 到 从 消费 者 穿戴 设备 到 智能 城市 蓝图 
的 不 同 对 象 。 你 认为 哪个 更 像 科 幼小 说 ， 哪 个 切实 可 行 ， 并 将 会 改 
生 ? 


温 顿 ， 改 变 发 生 在 各 个 方面 ， 我 认为 这 是 相当 惊人 的 。 有 许多 人 
们 可 以 罕 戴 的 设备 ， 合 歌 眼 镜 是 早期 的 例子 之 一 。 但 Fitbit 等 帮助 记录 
人 体 运动 时 的 生命 体征 的 设备 都 很 常见 。 这 无 疑 已 经 发 生 了 。 还 有 其 
他 设备 正成 为 我 们 生活 的 一 部 分 ， 比 如 有 的 设备 能 让 你 的 笔记 本 电脑 
将 信息 发 送 到 巨大 的 电视 屏幕 上 ， 这 样 你 就 可 以 译 受 到 更 好 的 视觉 体 
验 ， 有 网 络 功能 的 温 控 右 等 可 以 让 你 远程 控制 温度 ， 或 了 解 并 确定 房 
子 的 状态 ， 也 许 为 了 确保 房子 无 损 ， 你 还 可 以 看 一 下 摄像 机 。 


各 种 各 样 像 这 样 的 事情 正在 发 生 ， 我 认为 在 接 下 来 的 儿 十 年 里 ， 
我 们 将 看 到 各 个 方面 的 高 速 进步 。 所 以 老实 说 ， 我 不 认为 这 是 科幻 小 
说 。 甚 至 我 们 在 谷歌 研发 的 目 动 当 驶 汽车 也 不 再 是 科幻 小 说 ， 因 为 它 
们 实际 上 已 经 上 路 了 。 


但 我 担心 的 一 件 事 是， 许多 这 些 设备 在 设计 和 制造 时 ， 可 能 只 有 
相对 较 小 的 处 理 能 力 。 问 题 是 ， 例 如 ， 它 们 是 否 有 足够 的 处 理 能 力 来 
加 密 流 量 ， 以 确保 数据 的 隐私 。 我 们 应 该 非常 关注 这 些 系统 的 安全 
性 、 保 密 性 和 私密 性 ， 因 为 收集 到 的 大 量 数 据 可 以 被 解读 和 滥用 。 举 
个 例 季 ， 如 果 你 的 房子 周围 有 一 堆 温 度 传 感 磊 ， 别 人 殉 可 以 通过 连续 
的 监测 来 了 解 ， 有 和 多少 人 住 在 房子 里 ， 他 们 在 哪里 ,日 常生 活 习 惯 古 
什么 ,什么 时 候 在 家 ， 什 么 时 候 不 在 家 。 


因此 ， 我 们 在 信息 物理 系统 中 面 对 很 多 安全 性 、 保 密 性 和 私密 性 
的 挑战 ， 一 切 的 互联 网 空间 部 需要 一 些 非常 严肃 的 研究 和 开发 ， 以 克 


服 或 防止 这 些 信息 物理 设备 的 潜在 小 用。 


作者 : 你 提 到 的 信息 隐私 确实 是 许多 人 越 来 越 关注 的 问题 ， 特 别 
征 当 它 可 能 涉及 物理 对 象 时 。 当 我 们 购买 连接 “物品 >”， 不 知道 它们 的 
安全 功能 什么 时 候 会 过 时 ， 我 们 应 该 担心 这 个 问题 吗 ? 


温 顿 ， 我 们 当然 应 该 担心 这 个 问题 。 事 实 上 ， 如 果 设 备 无 法 持续 
更 新 ， 以 修复 使 用 中 的 错误 ， 从 而 导致 漏洞 ， 我 认为 就 不 应 该 买 ， 更 
不 用 说 销售 。 我 担心 会 出 现 “100 000 台 冰箱 袭击 美国 银行 ”那样 的 新 闻 
标题 ， 因 为 它们 感染 了 恶意 软件 ， 并 发 起 这 种 拒绝 服务 攻击 。 我 们 有 
非常 重要 的 技术 工作 要 做 ， 以 确保 设备 只 由 授权 方 控制 ， 它 们 积累 的 
数据 只 向 授权 方 开放 访问 。 我 们 最 终 几 乎 肯定 会 不 得 不 使 用 加 密 技 
术 ， 以 便 进行 强身 份 验证 ， 并 保护 数据 的 机 密 性 ， 例 如 ， 可 能 会 将 数 
据 从 信息 物理 系统 中 的 设备 移动 到 其 他 某 个 监控 系统 。 


作者 : 我 还 想 问 你 更 多 的 问题 ， 互 联网 周围 有 一 个 巨大 的 应 用 生 
态 系统 。 你 最 喜欢 的 应 用 程序 是 什么 ? 


温 顿 : 这 是 个 很 有 趣 的 问题 ， 因 为 每 当 有 人 说 起 应 用 程序 时 ， 我 
当然 会 认为 这 表示 移动 程序 。 我 意识 到 你 的 问题 并 不 是 我 想 的 这 么 狭 
隘 。 


所 以 ， 老 实说， 我 使 用 得 最 多 的 服务 其 实 是 谷歌 。 这 不 是 因为 我 
在 合 歌 工作 ， 只 古 因为 在 网 上 寻找 东西 是 非常 有 价值 ， 也 是 非常 困难 
的 ， 而 谷歌 使 其 变 得 容易 ， 并 频频 给 出 我 寻找 的 答案 。 


我 使 用 应 用 程序 定期 跟踪 股票 市 场 和 我 自己 的 投资 组 合 。 我 自己 
使 用 流 媒体 视频 ， 要 么 看 吸引 我 注意 的 YouTube 片 段 或 网 飞 电影 。 在 
有 足够 带宽 来 支持 在 线 播放 音频 和 视频 的 地 方 ， 这 些 应 用 程序 非常 流 
行 。 


所 以 对 我 来 说 ， 这 些 都 是 方便 收集 信息 的 应 用 程序 。 我 在 网 上 看 
报纸 ， 而 不 是 在 家 看 纸 质 报纸 ， 每 天 都 是 这 样 。 我 是 一 个 电子 邮件 的 
忠实 用 户 ， 我 的 许多 同事 和 同龄 人 也 和 是。 尽管 还 有 其 他 交流 方式 ， 比 
如 发 短信 、 脸 书 或 Google+， 但 它们 都 没有 电子 邮件 的 使 用 频率 高 。 最 
后 ， 我 发 现 最 近 几 年 视频 会 议 的 使 用 越 来 越 多 ， 这 天 不 多 吏 是 我 们 现 
在 做 的 。 这 是 一 个 了 不 起 的 进步 ， 因 为 谷歌 环 聊 允 许多 方 同时 互动 ， 
使 人 们 可 以 进行 远程 会 议 ， 这 几乎 使 避免 出 差 成 为 可 能 。 


我 使 用 的 男 一 个 应 用 程序 古谷 歌 文档 系统 的 文档 、 电 子 表格 、 文 
本 文件 和 演示 文稿 。 特 别 是 与 视频 会 议 应 用 相连 的 文本 文档 ， 它 其 实 
征 一 个 非常 强大 的 组 合 。 我 与 另外 两 三 个 作者 合作 写 论 文 ， 我 们 在 里 
面 同时 交谈 ， 既 可 能 看 到 对 方 ， 也 可 以 同时 编辑 一 个 共 至 文件 。 与 让 
一 个 人 负责 编辑 文本 不 同 ， 在 这 里 任何 人 都 可 以 目 由 地 编辑 并 吸引 其 
他 人 关注 。 由 于 这 是 实时 的 讨论 ， 我 们 发 现 ， 比 起 互相 之 间 发 送 电 子 
邮件 附件 ， 这 种 方式 会 让 完成 最 终 文件 的 速度 快 得 多 。 所 以 ， 这 种 以 
合作 的 方式 同时 实时 工作 的 能 力 是 非常 强大 的 。 


作者 : 温 顿 ,谢谢 你 与 我 们 分 享 你 的 见解 。 


任 谢 


几 位 人 士 对 本 书 的 不 同 部 分 进行 反馈 ， 我 对 他 们 表示 感谢 布 
里 、 汉 克 、 克 尔 斯 胖 、 洛 蕾 塔 、 雷 、 苏 珊 、 维 基 以 及 益 心 ( 音 ) 。 同 
样 感谢 校对 本 书 最 初版 本 的 许多 人 : 伊 森 、 哈 维 斯 特 、 凯 符 、 汞 、 普 
拉 纳 夫 、 罗 恩 ， 还 有 妈妈 和 爸爸， 以 及 在 我 们 的 聚 课 上 发 现 了 错别字 
的 学 生 。 我 也 感谢 所 有 在 我 的 iTunes 音 乐 库 中 的 艺术 家 ， 陪 伴 我 度 过 
写作 历程 ， 尤 其 古 安 迪 . 麦 基 、 老 座 乐 队 、 旅 行乐 队 、 林 纳 德 .斯 金 纳 德 
和 苑 海伦 乐 了 从。 最后， 以 及 最 重要 的 是 ， 在 我 的 未 婚 麦 、 家 人 和 朋友 
无 条 件 的 爱 和 文 持 下 ， 本 书 才 得 以 完成 。 非 党 感谢 这 些 了 不 起 的 人 。 


布 林 顿 
2016 年 6 月 


多 年 来 ， 我 的 老师 和 学 生 们 教会 我 很 多 关于 学 习 的 道理 。 感 谢 和 
我 一 起 工作 的 同事 。 也 感谢 四 位 有 远见 的 领导 者 ， 同 意 化 时 间 与 我 面 
谈 。 同 时 感谢 来 目 古 根 海 姆 基金 会 的 文 持 。 


我 不 断 疝 家 人 支取 时 间 ， 让 目 己 沉溺 于 各 种 各 样 的 好 奇 之 旅 。 我 
的 妻子 和 父母 一 直 宠 着 我 ， 包 容 我 的 庆 重 透 文 。 人 至 于 我 的 孩子 们 : 庄 
维 亚 可 能 会 认为 这 本 书 就 像 我 的 演讲 一 样 ， 太 长 了 。 奥 古 斯 坦 喜 欢 把 
书 撕 坏 。 而 微微 亚 ， 好 吧 ， 我 会 偷 个 懒 ， 把 这 本 书 作为 她 在 2016 年 11 
月 一 少时 的 一 件 生日 礼物 。 


蒋 江 


2016 年 6 月 


